כיצד לבנות יישום זיהוי דיבור

הכנת תוכנת זיהוי דיבור

שלב 1

קבוצת התוכנה שלך עם תוכנית זיהוי קול, כגון Dragon NaturallySpeaking או ViaVoice מ IBM. אם אתה מפתח תוכנה, תן את האפשרות למשתמש לקנות את התוכנה. כחלק מתהליך ההתקנה של היישום, יש למשתמש גם להתקין את תוכנית זיהוי הקול.

שלב 2

הגדר את תוכנת זיהוי הדיבור. כדי שהיישום שלך יוכל לנצל את מלוא היתרונות של זיהוי קול, יש להגדיר את התוכנית כהלכה. פירוש הדבר כי הגדרות המיקרופון והשפה חייבות להיות מותאמות באופן נאות כדי לנצל את יכולות התוכנית.

שלב 3

לאמן את תוכנית זיהוי הדיבור. זה יכול להיעשות מחוץ ליישום, בהתאם לאופי שלה. אם זה המקרה, רוב תוכניות זיהוי הקול כוללות תוכניות הכשרה ומסכים, או התוכנית יכולה להיות מאומן במעבד תמלילים.

שלב את הזנת הטקסט

שלב 1

בנה טקסט או טקסט עשיר שליטה ביישום שלך. רבים של תוכניות זיהוי דיבור לעבוד עם כל התוכניות שיש להם אפשרויות הזנת טקסט. אם מה שאתה צריך הוא המבוא של מילים, היישום כנראה לא צריך שום שינוי לעבוד עם תוכנית זיהוי דיבור.

שלב 2

כולל שטח נוסף בשלט הזנת הטקסט. מאז תוכניות זיהוי דיבור יכול לזהות דיבור בקצב מהיר יותר מאשר רבים יכולים לכתוב, ייתכן שיהיה צורך להגדיל את הגודל של פקדי הזנת טקסט. להשאיר מספיק מקום לכתוב טקסט ולסקור בזמן אמת.

אינטראקציה באמצעות ממשק API

שלב 1

הוא משתמש בממשק תכנות יישומים (API) כדי לתקשר עם תוכנת זיהוי דיבור. תוכניות רבות להכרה קולית כוללות ממשק API ליישומים אחרים לשימוש. השימוש באחד יאפשר ליישום שלך לקבל גישה מלאה לכל פונקציות זיהוי הקול וייתן למשתמש שליטה מלאה על היישום באמצעות דיבור.

שלב 2

שלב את ה- API ביישום. זה עשוי לכלול ביצוע יותר מ "מצב" אחד של שליטה קולית. יצירת מילים הפקודה, כגון "שמור קובץ" או "ליצור קובץ חדש". בעת הזנת טקסט, המשתמשים צריכים גם להיות מסוגלים לערוך מבלי לגעת בלוח המקשים ולהפעיל את תכונות הטקסט העשירות, כגון מודגש, מודגש, קו תחתון ושינויי גופן אחרים.