کارشناسان شرکت دانشبنیان «عصر گویش پرداز» با تکیه بر هوش مصنوعی نرمافزار تبدیل گفتار به متن فارسی «نویسا» را طراحی و تولید کردهاند
پردازش هوشمند صوت فارسی با محصولات عصر گویش پرداز
امروزه به لطف پیشرفتهای چشمگیری که در عرصههای مختلف فناوری و از جمله هوشمصنوعی بهدست آمده است، دیگر از گوشیهای هوشمند میتوان انتظار هر کاربردی را داشت؛ برای نمونه یکی از پرطرفدارترین کاربردهای این دستگاهها، اجرای فرمانهای صوتی است. این امر با استفاده از فناوری تبدیل گفتار به متن امکانپذیر شده و ارتباط انسان با تلفن همراهش را به سادهترین شکل ممکن تبدیل کرده است. تبدیل متن به گفتار، احراز هویت از طریق صوت، ایجاد رمزهای صوتی، چتباتها و... کاربردهای دیگری هستند که با بهکارگیری هوشمصنوعی در زمینه پردازش سیگنالهای صوتی ایجاد شدهاند. شرکت دانشبنیان «عصر گویش پرداز» از مجموعههای فناور در کشور است که حدودا دو دهه پیش وارد این عرصه شد و تاکنون محصولات متنوعی برمبنای پردازش صوت ارائه کرده است.
محمدرضا حسینیان در خصوص زمینههای فعالیت مجموعه تحت مدیریتش میگوید: «امروزه در دنیا ابرشرکتهای نرمافزاری ابزار مختلفی را تولید کردهاند که توانایی اجرای فرامین صوتی انسان را دارند؛ اما پردازش صوت جنبههای گوناگونی دارد که فقط یکی از آنها اجرای فرمان صوتی است؛ برای مثال توانایی صحبت به زبانهای مختلف، همواره از علاقهمندیهای بشر بوده است. در حال حاضر ساخت یک مترجم ماشینی که بتواند صحبتهای کاربر را همزمان به زبانهای دیگر تبدیل کند، تقریبا دستیافتنی شده است؛ البته این فناوری هنوز در خصوص زبان فارسی بسیار نوپاست، اما آینده روشنی دارد.» این فناور داخلی میافزاید: «این موارد بخشی از امکاناتی هستند که با بهکارگیری هوشمصنوعی در زمینه پردازش سیگنالهای صوتی و زبان طبیعی انسان، ایجاد شدهاند. درهمین راستا، شرکت ما نیز محصولات متنوعی را طراحی و تولید کرده است که وجه اشتراک همه آنها، استفاده از زبان فارسی بهعنوان زبان اصلی و پایهای است. محصولات ما شامل نرمافزارهای مختلفی برای تبدیل متن به گفتار، تبدیل گفتار به متن، دستیار هوشمند و... است.»
برترین نرمافزارهای
«عصر گویش پرداز» در یک نگاه
تایپ گفتار فارسی با «نویسا لایو» (Nevisalive)
محصول تبدیل گفتار به متن شرکت عصر گویش پرداز، اولین ابزار تبدیل گفتار به نوشتار فارسی در جهان بوده است. نسخه بهروز شده این محصول که مبتنیبر فناوری هوشمصنوعی ساخته شده است، «نویسا لایو» نام دارد و امکان تایپ فارسی با سرعتی معادل گفتار را به کاربر میدهد. ویژگی منحصربهفرد این محصول، قابلیت تبدیل گفتار محاورهای به متن است که به کاربر اجازه میدهد فایل صوتی حاصل از سخنرانیها، کلاسهای درسی، مکالمهها و... را در نرمافزار نویسا لایو بارگذاری کرده و سپس آن را بهصورت تایپ شده دریافت کند. امروزه نویسا لایو در زمینه تولید زیرنویس فارسی برای فیلمها بهطور گستردهای مورد استفاده قرار میگیرد.
دستیار هوشمند «رومَند» (Romand)
نرمافزار رومند، تجربه شیرین پشتیبانی خودکار را برای کاربر فراهم میکند. این محصول در واقع یک «چتبات» هوشمند است که بهصورت کاملا خودکار، توانایی مکالمه با کاربران را دارد. با استفاده از دستیار هوشمند رومند میتوان یک ارتباط دوسویه با هوشمصنوعی ایجاد کرد؛ برای مثال این نرمافزار میتواند بهشکل خودکار پاسخگوی سوالات و نیازمندیهای مشتریان یک کسبوکار باشد و با حذف هزینههای مربوط به استخدام یک تیم خدماتدهی آنلاین، صرفهجویی قابلتوجهی در هزینههای آن کسبوکار ایجاد کند. همچنین بهعنوان یکی دیگر از مزایای دستیار هوشمند رومند، میتوان به استفاده از ماژولهای تبدیل گفتار به متن و برعکس اشاره کرد. این ویژگی باعث میشود کاربر با هوشمصنوعی، ارتباط دوسویه کلامی برقرار کند؛ به این معنی که فرد درخواستش را بهشکل گفتار اعلام میکند و سپس نرمافزار با کمک هوشمصنوعی، صحبتهای کاربر را متوجه شده و پاسخ مناسب آن را مجددا بهصورت گفتار به او اعلام میکند.
سامانه تبدیل متن به گفتار «آریانا» (Ariana)
این محصول میتواند هرگونه متنی که با خط فارسی نوشته شده باشد را به گفتار تبدیل کرده و با صدای طبیعی انسان بیان کند. کاربران میتوانند با استفاده از نرمافزار آریانا کتابهای الکترونیکی را بهصورت صوتی گوش دهند یا از اخبار موجود در سایتهای خبری بهشکل شنیداری مطلع شوند. همچنین بهکمک اپلیکیشن «آریانا موبایل» که از طریق «کافه بازار» در دسترس عموم قرار دارد، میتوان از کلیه شبکههای اجتماعی بهصورت گویا استفاده کرد یا هنگام رانندگی پیامهای خود را شنید. بخش عمدهای از جامعه هدف آریانا را نابینایان و کمبینایان تشکیل میدهند که با بهکارگیری این سامانه میتوانند متون موردنظرشان را بهشکل صوتی گوش دهند؛ ضمنا یکی دیگر از مخاطبان آریانا، افرادی هستند که سواد کمی دارند یا کاملا بیسواد هستند. این دسته از کاربران نیز به این روش میتوانند متون سخت را بهآسانی مورد استفاده قرار دهند.
مسیر پیشِرو هموار است
این فناور داخلی درباره چشماندازی که برای مجموعه دانشبنیان عصر گویش پرداز درنظر گرفته شده است میگوید: «با توجه به رویکرد توسعه فناوری هوشمصنوعی در کشور، هدف بلندمدت ما حفظ پیشرو بودن در این حوزه است و قصد داریم به یک شرکت بینالمللی در زمینه هوشمصنوعی و پردازش سیگنال تبدیل شویم؛ البته در حال حاضر نیز با کشورهای همسایه و حتی با برخی کشورهای اروپایی، در زمینه تبادل دانشفنی و محصول مراوداتی داریم.» حسینیان در پایان ضمن اشاره به چشماندازی که این مجموعه در خصوص دستیار هوشمند رومند درنظر گرفته است، خاطرنشان میکند: «هدف نهایی ما از تکامل و بهبود مستمر این محصول، رسیدن به سطح بهترین دستیاران صوتی دنیا مانند «سیری» (SIRI) از شرکت «اَپِل» (Apple) یا «گوگِل اسیستَنت» (Google Assistant) است. امیدواریم زمانی برسد که ما نیز در عرصه بینالمللی، یک دستیار هوشمند همهکاره ایرانی بهنام رومند داشته باشیم.»
نقاط قوت محصولات
«عصر گویش پرداز»