עבור לתוכן

באיזו שפה ניתן לכתוב תוכנה לזיהוי קול?

Featured Replies

פורסם

אני מעוניין לבנות תוכנה לזיהוי קול, אך אין לי מושג איזו שפת תכנות מאפשרת קבלת קלט קולי.

כמובן שאיני מתכוון לתכנת תוכנה המתיימרת להיות תוכנה המזהה דיבור אלא רק פקודות קוליות בשביל הדגמה כלשהי והתנסות אישית.

המטרה העיקרית שלי היא ליצור אפשרות של הקלטת טקסט כלשהו, שמירתו, וכשהוא יאמר שוב תתבצע פעולה מסוימת שהמחשב הגדיר.

הצעות?

פורסם

בגדול זה לא מגבלת שפה מסוימת, אלה איזה ספריה מאפשרת לך להשתמש. אתה צריך דבר ראשון להגדיר תחת איזה מערכת הפעלה אתה עובד, ואתה צריך להחליט באיזה שפה יהיה יותר נוח לבצע את מה שאתה רוצה לעשות אח"כ, כי לכל שפה הגיונית אמור להיות ספרייה חיצונית שמאפשרת גישה להקלטה (בחלק אולי זה יהיה יותר מסובך, אבל עדיין אפשרי).

פשוט תריץ חיפוש על audio sampling עם שפת התכנות שמעניינת אותך, למשל java audio sampling:

http://www.developer.com/java/other/article.php/1565671

פורסם

יש לי הרגשה חזקה שהספריה של מיקרוסופט זה מה שאתה מחפש. לא זוכר איך קוראים לה. שיחקתי איתה די מזמן..

פורסם

אני ממליץ לך על שפת ++C, אבל תצטרך ידע נרחב בתחום של עיבוד אותות ספרתי DSP, השאלה היא מה אתה רוצה לעשות בדיוק ?

אם מדובר בהקלטה אז זה דיי פשוט וניןת לביצוע ע"י ++C בשימוש ב- MFC,

לצורך זיהוי של דיבור תצטרך לבצע דגימה של האותות, סינון רעשים (ניתן לממשך פילטרים בקלות בתוכנת MATLAB ואז להעביר לC או ++C), לאחר מכן שיש לך אות מסונן מרעשים תוכל להפעיל אלגוריתם לזיהוי יש כמה כאלו הפופולארי ביותר לדעתי הוא ICA (שהוא נחרחבה של אלגוריתם אחר שנקרא PCA).

מעבר לכך אם אתה מעוניין, יש ערכות לימוד הכוללות חומרה ייעודית לצורך עיבוד קול. אני אישית עבדתי עם בקר DSP של חברת TI. הערכות עולות בין 300$ ל- 500$ , תלוי בסוג הבקר שאתה מעוניין ולרכיבים על הלוח, וכוללות קומפיילר ייעודי של TI לבקר (נקרא CCS), ספר הדרכה בסיסי ב- DSP ודרייברים. הבקר ניתן להתקנה על כל PC בחיבור PCI או USB.

תמצא מידע נוסף בקישור :

http://focus.ti.com/dsp/docs/dspgettingstarted.tsp?sectionId=4

פורסם

אני ממליץ להתחיל דוקא קודם כל מ-Matlab. שם יש את כל הכלים הדרושים לצורך מחקר האלגוריתם שלך לזיהוי קול. שם תוכל לבדוק אותו מכל הכיוונים ולראות מה הוא באמת שווה, והספרייה שם מספקת לך את כל הפונקציות המתמטיות הדרושות.

רק אחר כך תחליט על שפה לבניית התוכנה עצמה, אחרי שתבנה לך את שיטת זיהוי הקול שלך. וזה באמת לא משנה באיזו שפה זה יהיה. כל שפה תעבוד.

ארכיון

דיון זה הועבר לארכיון ולא ניתן להוסיף בו תגובות חדשות.

דיונים חדשים