תיקון Unicode במסמך- - תוכנה - HWzone פורומים
עבור לתוכן
  • צור חשבון

תיקון Unicode במסמך-


baruchiro

Recommended Posts

יש לי מסמך טקסט (csv במקור) שמוצג בג'יבריש.

כשאני מנסה לפתוח אותו בWord הוא מציע לי כל מיני קידודים שונים, אבל בכולם הוא לא מתקן אותו לצורה הנכונה.

ניסיתי גם קצת בעזרת LibreOffice בלינוקס.

 

מצד שני, כשאני מכניס את הטקסט לאחד האתרים של היפוך בג'יבריש לעברית, האתר מתקן לי את הטקסט.

 

איך אני יכול לסדר את זה במחשב?

מכיוון שמדובר בCSV בסופו של דבר, אפשר גם להציע פתרונות בעזרת Excel ומסדי נתונים.

אפשר גם להציע פתרונות ע"י תכנות (.NET).

(אני מנחש שיש API של תיקון מג'יבריש לעברית, אבל לא מצאתי...

 

הקובץ-

https://docs.google.com/document/d/1AcAxfAuuNDasTpVsm9pSOTvgnryt7xB0Bbap1iyNtIo/edit?usp=sharing

 

תודה רבה וחג שמח!

קישור לתוכן
שתף באתרים אחרים

קיים פתרון בעזרת תוכנה מתקדמת במיוחד שנקראת Notepad:

אתה מעתיק לתוכה את הטקסט המקורי של ה-csv (קופי-פייסט), שומר בעזרת Save As כ-Unicode ואחר כך פותח את מה ששמרת כ-Ansi.

 

שים לב: כשאתה בוחר את הקובץ ששמרת, לפני שאתה פותח, אתה צריך לבחור Ansi בתפריט.

 

עזר? תזמין אותי לבירה.

(אבל לא בפסח... :))

קישור לתוכן
שתף באתרים אחרים

טוב, זה עבד פחות או יותר...

אז אכן המסמך נפתח בעברית, אבל הוא כבר לא CSV לפי מה שנראה.

ואם אני מנסה לפתוח אותו בAccess למשל, אני יכול למצוא לו אפשרות לפתוח בעברית, אבל זה אומר שיש @ בין כל אות, והוא בכלל לא מצליח לייבא את הנתונים.

(בExcel בכלל לא הצלחתי להגדיר קידוד שמציג בעברית...)

 

אז אם יש עוד רעיונות איך להתקדם מפה- אני אשמח.

קישור לתוכן
שתף באתרים אחרים

נו, אם זה עבד...

אז עכשיו הזמן להציע פתרון תכנותי: תמיר את התוצאה (שאם אני זוכר נכון מכילה מחרוזות בגרשיים ורווחים במקום מחרוזות בין פסיקים) לטקסט עם פסיקים.

לא ביג דיל, מי שיודע #C יעשה את זה ברבע שעה. אפשר עם לולאה, אפשר אולי עם split + join...

קישור לתוכן
שתף באתרים אחרים

ציטוט של none77

אולי התכוונת לnotepad++?

לא לא...

אפשר גם בnotepad עצמו, זה היה בסה"כ לשמור בקידוד שונה, זה אפשרי כמעט בכל תוכנה לעריכת מסמכים.

 

E71, זה לא בדיוק הפתרון הנכון, כי יש לי 2 תוצאות-

תוצאה אחת היא מסמך CSV שרק כשאני פותח אותו בקידוד ANSI אני מקבל מסמך בעברית. הפתרון היעיל במקרה כזה יהיה לקרוא אותו בקידוד הזה דרך #C, ולכתוב אותו לקובץ חדש עם הפסיקים והמעברי שורה כמו שאמרת.

יש אפשרות לקרוא קובץ לפי קידוד מסוים בעזרת #C?

(אל תטרח לענות, לא עשיתי עדיין ..)

 

תוצאה שנייה היא יצירת טבלה בAccess מתוך הCSV, שנותנת לי מחרוזות שכל תו בהם מופרד עם @, ובסופו של דבר שום דבר לא נכנס בכלל לטבלה.

 

אני אנסה את הפתרון לתוצאה הראשונה ואחזיר תשובה.

קישור לתוכן
שתף באתרים אחרים

בהצלחה... אולי לא הבנתי אותך נכון קודם, חשבתי שמדובר בעבודה חד פעמית (להמיר קובץ אחד).

אם הכוונה למשהו שאתה צריך לעשות כל הזמן כמובן שלשמור כל פעם בנוטפד ולעבור דרך תוכנה אח"כ זה לא זה, אבל אני די בטוח שתסתדר עם לעשות את הכל ב-#C...

זה אפשרי, יש שם תמיכה בכל הקידודים.

 

none77 - בדיאלוג הפתיחה והשמירה של ה-notepad הרגיל יש אפשרות לבחור קידוד, והאמת שהרבה אנשים לא זוכרים שזה קיים שם :)

 

קישור לתוכן
שתף באתרים אחרים

בדיוק באתי לערוך את התשובה שלי.

ובדיוק באמצע התגובה שלי הבנתי את הטעות שלי.

 

הנקודה שעצרה אותי הייתה שאני מצליח לקרוא מה שכתוב בקובץ- ע"י שמירה בUnicode ופתיחה בANSI.

הבעיה היא שאני לא יכול לקרוא את הקובץ דרך תוכנה אחרת, כי הוא עדיין בUnicode, ולשמור אותו בANSI זה לא עובד.

 

אגב, גם לנסות לקרוא אותו דרך #C זה לא פותר את הבעיה- עשיתי לולאה שקוראת אותו בכל הקידודים האפשריים שיש פה-

https://msdn.microsoft.com/en-us/library/windows/desktop/dd317756%28v=vs.85%29.aspx?f=255&MSPPError=-2147217396

 

מה שלא חשבתי עליו הוא פשוט מאוד-

ברגע שהצלחתי לפתוח את הקובץ בצורה קריאה (ANSI), אני יכול פשוט להעתיק את הטקסט לNotepad אחר, ולשמור באיזה קידוד שאני רוצה.

ומשם כמובן לסדר חזרה פסיקים וכו' כדי לחזור לCSV.

 

תודה!

קישור לתוכן
שתף באתרים אחרים

למה לנוטפד אחר? אפשר באותו נוטפד לשנות ולשמור באיזה קידוד שרוצים! (ואולי בעצם אני פספסתי עכשיו משהו? גם אם כן... לא חשוב :))

 

העיקר שהסתדרת...

קישור לתוכן
שתף באתרים אחרים

ארכיון

דיון זה הועבר לארכיון ולא ניתן להוסיף בו תגובות חדשות.

×
  • צור חדש...