טכנולוגיית זיהוי הקול החדשה של מיקרוסופט יכולה לתרגם את הקול הטבעי שלך לשפה אחרת [וידאו]

Apr 12, 2023 Uncategorized

השימוש במוצרי זה זה מול זה לחיבת המשתמשים. שניהם מגיעים עם מערך היתרונות והחסרונות שלהם ורק ישתפרו כשאנחנו צועדים קדימה אל העתיד, אך נראה כי צוותי המחקר והפיתוח של מיקרוסופט עובדים על משהו קול המבוסס על עצמם מאחורי הקלעים שיכולים לשנות את הדרך בני אדם מתקשרים זה עם זה.

אם כי, סירי היא הרבה יותר חזקה מהחיפוש הקולי של גוגל בפלטפורמת iOS, שניהם בדרך כלל עובדים באותה צורה על ידי לכידת פקודות נשמעות מהמשתמש לפני שהם מפרסמים ועיבוד פקודה זו בשרת אחורי לפני ירידת התוצאה בחזרה למשתמש ופועל בבקשה. סרטון הועלה על ידי מיקרוסופט הכולל מצגת של ריק ראשיד המתווה את השיפורים שהחברה ביצעה בתחום עריצות המשתמש הטבעיות באמצעות דיבור אנושי.

מערכות מבוססות מחשב שמבינות דיבור אנושי אינן המצאה חדשה. ראינו שחרורים רבים לאורך השנים המראים התקדמות משמעותית בתחום זה, כאשר Siri ו- Google Colue Search היו כמה מהדוגמאות האחרונות לאופן בו ניתן ליישם טכנולוגיה זו בעולם האמיתי. עם זאת, מיקרוסופט ניסתה בשקט לנקוט בדברים כמה צעדים בנוסף על ידי בניית מערכת סביב טכנולוגיות שיכולות לא רק לזהות דיבור אנושי אלא גם לתרגם אותה לטקסט של שפה זרה ואז לחזור על המילים באותה שפה באמצעות קול מסונתז שנוצר להישמע כמו הרמקול.

ההפגנה על הבמה המציגה קצין המחקר הראשי של מיקרוסופט מציגה את הטכנולוגיה בפעולה על ידי הכרה במילותיו האנגליות המדוברות, הפיכתן לסינית בתצוגה המוקרנת ואז הכריזה בקול על אותו המשפט בדיוק בחזרה במנדרין. כל זה המוח נושף מספיק, אבל אז הדברים נלקחים מעט בנוסף כשאתה מבין שרשיד ועמיתיו האכילו את המערכת בשווי של יותר משעה של נתוני הקול שלו כדי לאפשר למערכת לחזור על המשפט במנדרין באמצעות שלו קול משלו!

הטכנולוגיה אינה הטובה ביותר והיא עדיין עושה טעויות, אבל זה באמת מדהים להבין שזה אפשרי. העתיד של האינטראקציה האנושית הוא לחלוטין באופק.

(באמצעות TechnetBlog)

אתה יכול לעקוב אחרינו בטוויטר, להוסיף אותנו למעגל שלך ב- Google+ או לאהוב את עמוד הפייסבוק שלנו כדי לעדכן את עצמך על כל הזרם ממיקרוסופט, גוגל, אפל והאינטרנט.

Leave a Reply

Your email address will not be published. Required fields are marked *