סקריפט פייתון לבדיקת התעדכנות של דף אינטרנט - תכנות - HWzone פורומים
עבור לתוכן
  • צור חשבון

סקריפט פייתון לבדיקת התעדכנות של דף אינטרנט


shaks

Recommended Posts

היי, המצב הוא כזה:

האוניברסיטה שלי קצת מפגרת כשזה נוגע לפרסום ציונים.

ישנו דף שעושים אליו LOGIN ואז שם מופיע רשימה של כל הבחינות, כאשר מתפרסם ציון מופיע כפתור ליד הרשומהה של הבחינה שעליו ניתן ללחוץ כדי לראות את הציון.

בגלל שלא בא לי לעשות ריפרש כל כמה דקות ולהתחבר בטלפון כדי לעשות ריפרש לראות אם התעדכנו ציונים חשבתי על לכתוב סקריפט פייטון שעושה לוגין ומרפרש וברגע שמשתנה מבנה העמוד (הרי אם יש ציון נוסף כפתור חדש בעמוד) שיתריע לי.

 

אשמח להכוונה לגבי ספריות/כלים למטרה הנ"ל (צריך שיידעו להתמודד עם עברית כי העמוד מכיל כיתוב בעברית) אולי אפילו הכוונה מה לכתוב.

 

תודה מראש

קישור לתוכן
שתף באתרים אחרים

לפייתון יש ספריית http נוחה בשם http.client.

הנה דף התיעוד הרשמי, יש שם גם דוגמאות בסוף.

 

בשביל להבין איך עובד הלוגין, אתה צריך קצת לנטר את התעבורה. אופציה אחת היא שימוש בכלים של הדפדפן עצמו, לדוגמה ה-inspector של , ואופציה אחרת היא באמצעות כלי לניטור תעבורה כמו Fiddler או Wireshark שמקליטים בדיוק איזה בקשות http יוצאות מהדפדפן.

קישור לתוכן
שתף באתרים אחרים

מה זה איך עובד הלוגין? זה טופס שעושה POST לאנשהו (ב-form רגיל או באג'קס), אין אפשרויות אחרות...

כמובן שאם הוא כותב את הסקריפט האוטומטי שלו אז הוא יצטרך לשלוח 2 קריאות - אחת שתעשה את הלוגין ואח"כ אחת שתקרא את הדף.

לא נראה לי שהוא חשב אחרת...

קישור לתוכן
שתף באתרים אחרים

  • 1 חודש מאוחר יותר...
ציטוט של shaks

היי, המצב הוא כזה:

האוניברסיטה שלי קצת מפגרת כשזה נוגע לפרסום ציונים.

ישנו דף אינטרנט שעושים אליו LOGIN ואז שם מופיע רשימה של כל הבחינות, כאשר מתפרסם ציון מופיע כפתור ליד הרשומהה של הבחינה שעליו ניתן ללחוץ כדי לראות את הציון.

בגלל שלא בא לי לעשות ריפרש כל כמה דקות ולהתחבר בטלפון כדי לעשות ריפרש לראות אם התעדכנו ציונים חשבתי על לכתוב סקריפט פייטון שעושה לוגין ומרפרש וברגע שמשתנה מבנה העמוד (הרי אם יש ציון נוסף כפתור חדש בעמוד) שיתריע לי.

 

אשמח להכוונה לגבי ספריות/כלים למטרה הנ"ל (צריך שיידעו להתמודד עם עברית כי העמוד מכיל כיתוב בעברית) אולי אפילו הכוונה מה לכתוב.

 

תודה מראש

 

היי

 

אתה צריך לראות איך המידע מגיע אל הדפדפן, זאת אומרת תצטרך "להסניף" את הרשת כדי לראות איזו בקשה שולחת את רשימת הציונים אל דף האינטרנט, זה יכול להגיע כדף HTML וזה יכול להגיע כJSON שיעדכן את הנתונים (איכשהו אני מאמין שמה שקיים זאת האופציה הראשונה).

 

בשתי המקרים הכלים שלך לעבודה אלו ספריות requests ו BeautifulSoup

הראשונה לתקשורת וקריאת JSON והשניה לניתוח הבקשה (במידה והתוכן הוא HTML ולא JSON)

 

תוכל לראות דוגמה בסקריפט הבא, הוא ממש את התקשורת עם ספריית urllib במקום requests כשהאחרונה פשוט קלה יותר לשימוש ומפשטת את העבודה עם urllib (למעשה היא מממשת את urllib בצורה נוחה יותר)

https://github.com/razielb/sdarot-dl/blob/master/sdarot-dl.py

 

הערות שנאמרו בקשר לסקריפט תוכל לראות פה

https://www.hacking.org.il/showthread.php/5193-Sdarot-tv-downloader?highlight=sdarot

 

 

בהצלחה

מקווה שהועלתי

קישור לתוכן
שתף באתרים אחרים

  • 2 חודשים מאוחר יותר...

סביר שהאונ' משתמשת ב- ssl. במקרה כזה הסיסמא כן מוצפנת, ולא תוכל לראות אותה ב- wireshark.

את אתה ממש רוצה אתה יכול להתקין fiddler ולראות את התעבורה המוצפנת שלך. רק אל תשאיר את זה פתוח הרבה זמן, כי הוא מתקין לך סרטיפיקט משלו וזה עשוי להיות מסוכן.

קישור לתוכן
שתף באתרים אחרים

ארכיון

דיון זה הועבר לארכיון ולא ניתן להוסיף בו תגובות חדשות.

×
  • צור חדש...