در این مقاله قصد داریم تا یکی از پرکاربرد ترین قابلیتهای گوگل را بررسی کنیم و ببینیم که چه مزایا و معایبی دارد. قابلیت مورد نظر ما تایپ صوتی در گوگل است که به کاربران این اجازه را میدهد تا بدون نیاز به تایپ کردن تنها با گفتن چیزی متن آن را داشته باشند. در ادامه با ما همراه باشید.
تایپ صوتی گوگل چیست؟
اگر بخواهیم تعریف دقیقی از این فناوری داشته باشیم، میتوانیم بگوییم که
تایپ صوتی گوگل در روی کیبرد اکثر گوشیهای هوشمند وجود دارد و در حقیقت همان نشانهی میکروفونی است که در پایین کیبرد و در سمت چپ دکمه فاصله قرار گرفته است. در رایانههای شخصی هم با استفاده از مرورگر کروم میتوانید از سرویس Google Doc کمک گرفته و از این فناوری استفاده نمایید.
در بروزترین نسخه این سرویس قادر است از 119 زبان زنده دنیا پشتیبانی کند و محتوای موجود در صوتهای این زبانها را به متن تبدیل کند.
چگونه از تایپ صوتی گوگل استفاده کنیم؟
کاربرانی که از گوشیهای هوشمند استفاده میکنند با زدن دکمهی میکروفون بر روی کیبرد گوشی خود میتوانند از تایپ صوتی گوگل بهرهمند شوند. در تصویر زید میتوانید محل این دکمه را مشاهده نمایید.
اگر از Google Docs استفاده میکنید با مراجعه به منو، قسمت Tools را باز کرده و گزینه Voice typing را فعال نمایید.
لازم به ذکر است که قابلیت تبدیل صوت به متن گوگل برای سازندگان اپلیکیشنی که میخواهند از قابلیت تایپ صوتی بر روی اپ خود استفاده کنند در دسترس میباشد و با پرداخت هزینه میتوانند api تایپ صوتی گوگل را دریافت نمایند.
آیا قابلیت تایپ صوتی گوگل بر روی زبان فارسی در ایران هم کاربرد دارد؟
بله، قابلیت تایپ صوتی گوگل بر روی زبان فارسی هم در دسترس کاربران فارسی زبان میباشد. با استفاده از راههایی که گفته شد کاربران میتوانند از مزایای سرویس تبدیل گفتار به نوشتار گوگل در زبان فارسی بصورت رایگان بهرهمند شوند. پس از فعال کردن قابلیت تبدیل گفتار به نوشتار میتوانید به آی زبان مراجعه کرده و پیش فرض زبان را تغییر داده و زبان فارسی را انتخاب نمایید. پس از اطمینان از صحت عملکرد و کیفیت میکروفونی که دارید میتوانید از تایپ صوتی بهرهمند شوید.
مزایای تایپ صوتی در گوگل چیست؟
گوگل در چند سال اخیر سرمایهگذاری سرسام آوری را بر روی فناوری زبان بر روی زبانهای مختلف در دنیا انجام داده است. نتیجهی این سرمایهگذاری فوقالعاده فناوری شده که در بسیاری از زبانها با کیفیت خوب گفتار را درک کرده و آن را به نوشتار تبدیل مینماید. از مزایای تایپ صوتی فوقالعاده گوگل میتوان به موارد زیر اشاره نمود:
سرعت فوقالعاده
قدرت تایپ کلمات یک فرد عادی بین 38 تا 40 کلمه در دقیقه میباشد که این تعداد برابر است با به طور میانگین 2400 کلمه در ساعت. اگر به جای روشهای تایپ قدیمی از تایپ صوتی گوگل استفاده شود این سرعت را میتوان تا چیزی حدود 4 برابر افزایش داد. یعنی در هر دقیقه به صورت میانگین 150 کلمه.
دسترسی بالا
از آنجایی که تایپ صوتی گوگل بر روی پلتفرمهای متفاوتی در دسترس است و در گوشیهای هوشمند نیز میتوان در هر کجا از آن استفاده کرد، میتوان در هر کجا از آن استفاده نمود. دیگر لازم نیست همانند روشهای قدیمی یک جا نشسته و ساعتها به تایپ کردن مشغول شوید.
دقت بالا
یک تایپیست معمولی به صورت میانگین از هر 100 کلمه 8 کلمه را اشکال دارد. در صورتی که با استفاده از تبدیل گفتار به نوشتار گوگل میزان خطا تا حد زیادی کاهش میابد. زیرا به جای نوشتن کلمات با استفاده از کیبرد، کلمات مستقیما به هوش مصنوعی گوگل گفته شده و او نیز آنها را به نوشته تبدیل کرده است.
توانایی تبدیل صوت به متن در هر پلتفرمی
به کمک سرویس تبدیل گفتار به نوشتار گوگل میتوانید فایلها را به هر فرمتی که میخواهید ذخیره کنید. زیرا بسیاری از نرم افزارهایی که از آنها استفاده میشوند قابلیت وصل شدن به سرویس تایپ صوتی را دارند. در غیر این صورت نیز میتوانید از پلتفرمهای گوگل برای تبدیل گفتار به نوشتار استفاده نموده و پس از ویرایش فایل نهایی آن را در پلتفرم مورد نظر کپی کرده و با فرمت دلخواه ذخیره نمایید.
پر واضح است اگر بخواهیم مزایای تایپ صوتی گوگل را بنویسیم، میتوانیم یک مقاله را به آن اختصاص دهیم. اما قصد ما در این مقاله بررسی کلی این قابلیت است و میخواهیم از تمام جوانب به آن نگاهی بندازیم.
معایب تایپ صوتی در گوگل چیست؟
شاید عنوان این بخش برای شما سوال بر انگیز باشد و بگویید مگر ممکن است که سرویسی که گوگل با آن همه عظمت ارائه میدهد عیب و یا مشکلی داشته باشد؟ باید بگوییم که برای کاربرانی که کارهای کوچکی با تایپ صوتی دارند و نمیخواهند به طور پیشرفته از آن استفاده کنند، این سرویس همانگونه که هست بسیار عالی خواهد بود و نقدی بر آن نیست. مشکل از جایی شروع میشود که بخواهیم از تایپ صوتی برای مقاصد پیشرفتهتر استفاده نماییم. در این بخش ممکن است با مشکلات زیر مواجه شویم:
نیاز به اتصال دائمی اینترنت
شاید بتوان گفت یکی از معایب این تایپ صوتی گوگل بخصوص در زبان فارسی آن است که در زمان استفاده از آن حتما باید به اینترنت دسترسی دائم داشته باشید. این مسئله شاید در استفادههای محدود و کم به چشم نیاید اما زمانی که نیاز دارید تا گفتارهای طولانی را به متن تبدیل کنید و یا در مکانهایی قرار دارید که دسترسی مناسبی به اینترنت ندارید، بسیار مشکل آفرین میشود.
سرور خارج از ایران
یکی از مشکلاتی که سازمانهای داخلی با آن روبهرو هستند، آن است که طبیعتا چون گوگل یک شرکتهای خارجی است، سرورهای آن نیز در خارج از کشور قرار دارد و سازمانها و شرکتهایی که دارای دادههایی هستند که نمیخواهند به خارج از سازمان برود، عملا نمیتوانند از تایپ صوتی گوگل استفاده کنند. زیرا آنها به سرویسهایی نیاز دارند که به صورت لوکال بر روی سرورهای خودشان نصب شود و هیچ اطلاعاتی را به بیرون از سازمان نفرستند.
عام بودن گفتار به نوشتار
یکی از مشکلاتی که کاربران فارسی زبان در استفاده از تایپ صوتی گوگل با آن مواجهه هستند، آن است که این سرویس تنها قادر است گفتار عام در زبان فارسی را متوجه شود و کلمات تخصصی در زبان فارسی که برخی کسبوکارها، همانند وکلا و حقوقدانان و…، از آنها به کرات استفاده میکنند را به درستی متوجه نمیشود. به همین خاطر کسبوکارهای این چنینی برای تبدیل گفتار به نوشتار و تایپ صوتی نمیتوانند بر کمک گوگل اتکا کنند.
نفهمیدن لهجههای مختلف زبان فارسی
زبان فارسی پر است از لهجهها و گویشهای مختلف. اگر نرم افزاری بخواهد در زبان فارسی به خوبی کار کند نیاز دارد که تمام این لهجهها را متوجه شود. متاسفانه همانطور که در مورد قبل به آن اشاره شد تایپ صوتی گوگل گفتار عام زبان فارسی را متوجه میشود و باز هم کاربران فارسی زبان با مشکلات بسیاری در این زمینه روبهرو هستند.
پولی بودن api سرویس تایپ صوتی گوگل
بسیاری از توسعه دهندگان اپلیکیشن که میخواهند از قابلیت تایپ صوتی در اپلیکیشن خود استفاده نمایند، اول از همه به سراغ سرویس گوگل میروند. برعکس اینکه تایپ صوتی گوگل بر روی سرویسهایی که خود ارائه میدهد رایگان میباشد، برای دریافت api آن به صورت دقیقهای باید هزینه پرداخت نمود. چون این هزینه به دلار محاسبه میشود برای کاربران داخلی استفاده از آن به صرفه نمیباشد و عملا نمیتوانند از تایپ صوتی گوگل استفاده نمایند.
زمانی که تایپ صوتی گوگل در زبان فارسی مشکل آفرین میشود چه کنیم؟
اگر شما هم در استفاده از تایپ صوتی در گوگل به معایبی که گفته شد و یا مشکلات دیگری برخوردید، تنها راه شما روی آوردن به سرویسهای تایپ صوتی دیگر است. سرویسهایی که بتواند همان کیفیت را با استانداردهای مورد نیاز شما در اختیارتان قرار دهد. اگر به دنبال چنین سرویسی هستید، ما فارس آوا را به شما معرفی میکنیم. سرویس فارس آوا یکی از بهترین موتورهای تبدیل گفتار به نوشتار در زبان فارسی می باشد.
محصول فارس آوا تبدیل گفتار به نوشتار را به صورت تخصصی برای زبان فارسی انجام می دهد و قادر است ارتباط کلامی بین شما و کامپیوتر یا موبایلتان را فراهم کند. محصول فارس آوا با تکیه بر دانش متخصصان هوش مصنوعی ایرانی و با بهره گیری از آخرین تکنولوژی های روز دنیا تولید شده است و به دلیل جمع آوری بزرگ ترین دیتاسِت موجود در زبان فارسی و تمرکز ویژه روی این زبان، ضمن بهره مندی از تنوع گفتاری بسیار وسیع موفق شده است تا در رقابت با شرکت های بزرگی چون گوگل (بر روی زبان فارسی) دارای ضریب دقت بالایی باشد.
محصول فارس آوا دارای قابلیت های زیر می باشد:
- تبدیل گفتار به متن فارسی با دقت و سرعت بالا
- بهره مندی از آخرین تکنولوژیهای یادگیری عمیق
- تبدیل گفتار به متن بصورت همزمان (Real-Time)
- تشخیص گفتار و صوت در محیط های نویزی
- پشتیبانی از انواع لهجه ها و گویش ها
- قابلیت تبدیل گفتار محاوره ای به متن
- پشتیبانی از انواع فرمتهای صوتی و ویدیویی
- تبدیل گفتار انگلیسی به متن انگلیسی
- غیر وابسته به گوینده و عدم نیاز به آموزش برای هر فرد
- ارائه API محصول فارس آوا و SDK تبدیل گفتار به متن در قالب وب سرویس
- ارائه پنل تحت وب برای آپلود کردن فایلها جهت پردازش
- قابل نصب روی سرور مشتری و عدم نیاز اتصال به اینترنت
- بهره مندی از دایره واژگان (فرهنگ لغت) بسیار وسیع
- تبدیل گفتار به نوشتار به کمک هوش مصنوعی
با توجه به قابلیت های ذکر شده، محصول فارس آوا می تواند چنین کاربرد هایی داشته باشد:
- امکان استفاده در تمامی سیستم های عامل (Android, IOS, Mac, Windows, Linux)
- امکان استفاده برای تمامی برنامه های تحت موبایل (تمامی پلتفرمها)
- امکان استفاده در برنامه هایی از قبیل دستیارهای شخصی هوشمند در موبایل
- امکان استفاده های عمومی از قبیل : تایپ گفتاری و اجرای دستورات صوتی
- امکان سفارشی سازی برای تشخیص دستورات خاص صوتی
- امکان سفارشی سازی برای کاربردهای خاص و افزایش دقت
- پردازش داده های حجیم گفتاری
علاوه بر آن فارس آوا دارای دو محصول جانبی میباشد که میتواند عملیات تبدیل متن به گفتار (TTS) و استخراج کلمات کلیدی (KWS) را انجام دهد. چنانچه قصد دارید با محصول فارس آوا بیشتر آشنا شوید به صفحه محصول فارس آوا مراجعه کنید و اگر درخواست دمو دارید به صفحه تماس با ما مراجعه نمایید.