-
המרת 50 קבצי pdf לקובץ טקסט python
שלום, יש לי 50 קבצי pdf ומנסה להמיר אותם לקבצי טקסט באופן איכותי. ניסיתי להשתמש בilovepdf ואקרובט רידר פרו. התוצאות לא היו משביעות רצון. לכן, פניתי לאוראקל מדלפוי, קרי ג'ימיני, ובקשתי עזרה. בהתחלה בנה לי תכנה עם בpython עם פונקצית Tesseract, להפתעתי התכנית רצה היטב (אני תכנתי בפעם האחרונה שלביסיק עוד היו מספרים בשורות) אבל לא הייתי מרוצה מהאיכות. ביקשתי פתרון אחר והוא הציע להשתמש ב Google Cloud Vision API. אחרי תלאות מרובות, הצלחתי לפתוח חשבון ולעשות את התכנה המבוקשת. אבל מקבל שגיאה: Vision API: [Errno 13] Permission denied: אני מנהל המערכת, כל ההרשאות נכונות, וניסיתי להריץ גם בתור מנהל. #import os from google.cloud import vision from google.oauth2 import service_account from PyPDF2 import PdfReader # חשוב: החלף את הנתיב הבא בנתיב האמיתי של קובץ ה-JSON של האישורים שלך CREDENTIALS_PATH = 'c:/nkhl/pdf-ocr-458306-55f58cef00dc.json' def pdf_to_text_with_vision(pdf_path, output_dir, credentials_path): """ ממיר קובץ PDF לקובץ טקסט באמצעות Google Cloud Vision API. Args: pdf_path (str): הנתיב לקובץ ה-PDF. output_dir (str): הנתיב לספרייה שבה יישמר קובץ הטקסט. credentials_path (str): הנתיב לקובץ אישורי ה-JSON של Google Cloud. """ try: # טעינת אישורים credentials = service_account.Credentials.from_service_account_file(credentials_path) client = vision.ImageAnnotatorClient(credentials=credentials) with open(pdf_path, 'rb') as pdf_file: pdf_reader = PdfReader(pdf_file) full_text = "" for page_num in range(len(pdf_reader.pages)): page = pdf_reader.pages[page_num] # חילוץ התוכן של העמוד כבייטס page_bytes = page.extract_raw_content() # יצירת בקשה ל-Vision API image = vision.Image(content=page_bytes) request = vision.AnnotateImageRequest( image=image, features=[vision.Feature(type=vision.Feature.Type.DOCUMENT_TEXT_DETECTION)] ) # שליחת הבקשה ל-API response = client.document_text_detection(request=request) # חילוץ הטקסט מהתגובה if response.full_text_annotation: full_text += response.full_text_annotation.text + "\n\n" else: print(f"לא נמצא טקסט בעמוד {page_num + 1} בקובץ {pdf_path}") output_filename = os.path.splitext(os.path.basename(pdf_path))[0] + "_vision.txt" output_path = os.path.join(output_dir, output_filename) with open(output_path, 'w', encoding='utf-8') as text_file: text_file.write(full_text) print(f"הומר בהצלחה באמצעות Vision API: {pdf_path} -> {output_path}") except Exception as e: print(f"שגיאה בעיבוד הקובץ {pdf_path} באמצעות Vision API: {e}") def process_pdf_files_vision(pdf_directory, output_directory, credentials_path): """ מעבד מספר קבצי PDF בספרייה נתונה וממיר אותם לטקסט באמצעות Vision API. Args: pdf_directory (str): הנתיב לספרייה שמכילה את קבצי ה-PDF. output_directory (str): הנתיב לספרייה שבה יישמרו קבצי הטקסט. credentials_path (str): הנתיב לקובץ אישורי ה-JSON של Google Cloud. """ if not os.path.exists(output_directory): os.makedirs(output_directory) for filename in os.listdir(pdf_directory): if filename.endswith(".pdf"): pdf_path = os.path.join(pdf_directory, filename) pdf_to_text_with_vision(pdf_path, output_directory, credentials_path) if name == "__main__": pdf_directory = input("הזן את הנתיב לספרייה עם קבצי ה-PDF: ") output_directory = input("הזן את הנתיב לספרייה שבה יישמרו קבצי הטקסט: ") credentials_path = input("הזן את הנתיב לקובץ אישורי ה-JSON של Google Cloud: ") process_pdf_files_vision(pdf_directory, output_directory, credentials_path) print("התהליך הסתיים באמצעות Google Cloud Vision API.") פתרונות יתקבלו בברכה.
-
מסך מחשב
בסוף אחרי חקירה מעמיקה ויסודית לבדי בלי עזרת הפורום 😠 ובלי עזרת ai😠 אצתי רצתי וקניתי כבל USB c display port. ועכשיו עובד. אוהד
-
מסך מחשב
המסך של דל עבד עם המחשב הקודם. כבל הוחלף. עם מחשב אחר עובד היטב. אוהד
-
מסך מחשב
-
מסך מחשב
שלום, נתון: לוח אם 1700 Asus Prime H610M-A-CSM DDR5 נתון מסך: Dell 27 inch מחבר מסך למחשב לא מזהה מחבר מסך גנרי עובד יופי כבל HDMI רעיונות יתקבלו בברכה, כן, גם להוסיף כרטיס מסך. בברכה, אוהד
-
מחשב נייח פנסיונר
שלום, מחפש מחשב נייח לאבא שלי. דרישות: תקציב 3000₪ בעל יכולת להריץ ווינדוס 11 אין צורך במקלדת, עכבר יעביר מהקודם יש לו הארד דיסק HDD ארוז, אז לא צריך רק SSD שלא יתקשר אליי כל שני וחמישי שהמחשב נתקע. עצות מנומקות יתקבלו בברכה, אוהד

Kaligula Imperar
משתמש רשום
-
הצטרפות
-
ביקר לאחרונה