עבור לתוכן

אילו אלגוריתמים קיימים לקריאת מספרים מתמונה?

Featured Replies

פורסם

שלום,

באתרים רבים יש קוד אבטחה המונע אוטומטיזציה. ישנם קודים מסובכים יותר וחלקם פחות.

בכל אופן, התעניינתי באופן הקריאה שלהם. כלומר, אילו אלגוריתמים קיימים לקבלת תמונה כזאת וקריאה שלה?

חשבתי על כמה אופציות..

1. רשת נוירונים שתלמד לקרוא את התמונה

2. נניח ומדובר במקרה הפשוט ביותר שהרווח בין הספרות זהה והספרות אינן בזוויות שונות.

לדוגמא:

votecodephpmu1.jpg

אז נניח במקרה הספציפי הזה חשבתי שאפשר להגדיר מראש מה המרחק בין כל ספרה, ותבנית מסוימת של כל ספרה ואז לבדוק את אחוזי הדמיון בין הספרות ולקחת את הספרה המתאימה ביותר. (גם מספר הספרות נתון).

הבעיה עם הרעיון הזה לגבי הוא שהוא עדיין מאוד מפושט ולא חשבתי איך אפשר לממש אותו וליצור את התבניות של המספרים.

יש לציין שאני מעוניין לדעת על כך למטרת למידה.

אילו אלגוריתמים קיימים לשם כך?

מה אתם אומרים על הרעיון שלי ואיך אפשר לדעתכם להפוך אותו למעשי יותר?

פורסם

זה הרבה יותר מסובך ממה שזה נראה (זה נקרא OCR אם אתה רוצה לקרוא מאמרים בנושא).

היום, רוב מפצחי הקאפצ'ות (קוד האבטחה שדיברת עליו) משתמשים במאגרים פרטיים של קאפצ'ות, שמכילים תמונה + קוד מתאים, וכיש תורך בהכנסת קוד - משווים את הקאפצ'ה עם הקאפצ'ות מתוך המאגר הפרטי, ואם יש התאמה לוקחים את הקוד מהמאגר הפרטי.

בכל מקרה, בהצלחה! :xyxthumbs:

פורסם
  • מחבר

קודם כל תגובה על התודה המהירה!

דבר שני, אני יודע שקוראים לכך OCR וגם קראתי עבודת מחקר עם רשתות נוירונים בנושא.

אני מחפש אלגוריתמים שקיימים כבר שאני אוכל להבין את הלוגיקה שלהם ושזה לא יהיה רשת נוירונים או אלגוריתם גנטי.

ברור לי שאם רוצים אפשר להסתבך אבל אני רוצה להתחיל מהמקרה הכי פשוט כמו בתמונה שהראתי ובהנחה שמספר הספרות ידוע, המרווח בין כל ספרה ידוע, הזווית וצבע של הספרות ידוע.

לאחר מכן נתעסק עם דברים יותר מסובכים כאשר הפרטמרים הללו משתנים, אבל עד אז יש עוד מה ללמוד.

פורסם

לא יודע מה זה רשת נוירונים או מזה אלגוריתם גנטי....

אבל זה נושא בעיבוד בתמונה.

אתה רוצה אלגוריתם? נראה לי שאתה צריך קצת יותר מזה... אתה צריך הבנה בעיבוד תמונות כולל התמרת פורייה, קונוולוציה וקורלציה...

במה אתה רוצה לממש את זה? בC? ב MATLAB?

עקרונית ברגע שיש לך תמונה של נניח הספרה '5' בלבד בגודל שתואם את התמונה שאתה רוצה לבדוק.

אז אתה צריך לבצע קורלציה בין 2 התמונות והתוצאה שלך תתן תמונה חדשה שבכל מקום שהיה בו '5' יהיו בו ערכים גבוהים כלומר יהיה

בו נקודה לבנה במרכז ה'5' שהיה פעם....עכשיו אתה צריך לזהות איפה יש את הנקודות הכי לבנות בתמונה החדשה וככל הנראה שם היה '5'...

בנוסף כדאי להריץ עוד מספר בדיקות על מנת לוודא ולעלות את הסיכוי שצדקת....

בכל מקרה זה לא פשוט... וזה כמובן מתאים לכל 2 תמונות לא רק למספרים...

כמו שנאמר קודם.....בהצלחה...

פורסם
  • מחבר

אז ככה:

רשת נוירונים ואלגוריתם גנטי הם נושאים בבינה מלאכותית, אם תרצה אני אשלח לך חומר על זה.

אני מעדיף לממש את האלגוריתם בסביבת C++ ואם בשביל להבין את האלגוריתם ורק לראות אותו בפעולה אני אצטרך, אז גם ב-VB.

עכשיו לגבי מה שאתה אומר יש קצת בעיה כי המיקום של הספרה הוא לא במדויק אותו דבר בין תמונה לתמונה, אלא יש הבדל של כמה פיקסלים.

exercise, תודה בדיוק חיפשתי איך קוראים לזה ולא הצלחתי למצוא. אני מאמין שעכשיו יהיה לי יותר קל למצוא הסברים ומאמרים בנושא.

עריכה:

למי שרוצה מצאתי אחלה מאמר שמסביר שיטה אחת לזיהוי:

http://www.cs.sfu.ca/~mori/research/papers/mori_cvpr03.pdf

אני חושב שאני כרגע לא אתעמק בזה כי אני עושה פרוייקט על זיהוי לפי קשתית העין. אבל בכל זאת, זה נושא מאוד מעניין וכנראה אחרי שאני אסיים עם הפרוייקט אני אקרא על זה.

למרות זאת, אם מישהו ימצא איזה קוד של captcha decoder אני אשמח לקבל אותו מכיוון שכרגע אין לי יותר מדי זמן להתעסק עם זה ואני מעוניין רק להבין את הרעיון הכללי.

פורסם

אולי מישהו פעם אחת יוכל לכתוב את הניק שלי בלי טעויות ?

ארכיון

דיון זה הועבר לארכיון ולא ניתן להוסיף בו תגובות חדשות.

דיונים חדשים