איך להוציא DOMAIN מתוך URL - תכנות - HWzone פורומים
עבור לתוכן
  • צור חשבון

איך להוציא DOMAIN מתוך URL


liiight

Recommended Posts

כחלק מעבודתי, אני צריך לעבוד עם DOMAINים, לא חשוב למה... בכל מקרה, הכנו איזה סקריפט שעובד על URL בצורה מסויימת כחלק מהסקריפט, המשתמש צריך לבחור אם הDOMAIN הוא מסוג DOMAIN.XXX (כמו CNN.COM למשל), או כמו DOMAIN.XX.XX (כמו HWZONE.CO.IL למשל) וגם שיידע לזהות כתובות שמתחילות בIP באופן אוטומטי.

ניסינו לחשוב על דרך שהקריפט יידע לזהות לבד את הצורה שהDOMAIN רשום בתוך הURL, אבל לא הצלחנו לחשוב על שיטה. אפשר לעשות את זה ע"י רשימה עם TLDS נפוצים, אבל זה די מפגר, כי יש המון המון TLDS וזה יהיה מאוד מסורבל. אני יודע שתוכנות כמו SMART WHOIS וVISUAL TRACE יודעות לעשות את זה מצויין, אבל אין לנו מושג איך.

אם למישהו יש רעיון מוצלח איך לעשות זה (ואם אפשר בPERL) אז זה יהיה נהדר. דרך אגב, לי באופן אישי אין הרבה ידע בתכנות, ככה שאם התשובה היא טכנית, אני אצטרך להעביר את זה הלאה כדי לקבל פידבק. בכל מקרה, אני מאמין שהפיתרון הוא תיאורטי, ולא תהיה בעייה להמיר אותו לכל שפה.

תודה מראש.

קישור לתוכן
שתף באתרים אחרים

אני לא חושב שלזה הוא התכוון

בנוסף לא תמיד מובטח לך שהקלט יהיה http://xxx.yyy.zzz/

ניסיתי לחשוב על זה בעצמי ובינתיים לא מצאתי שום פתרון מעבר לזה המסורבל (רשימה של כל ה TLDים...)

קישור לתוכן
שתף באתרים אחרים

אם הבנתי נכון זה די פשוט.

הולכים מימין לשמאל בחיפוש אחרי נקודה.

מצאת נקודה ראשונה אתה בודק כמה תוים יש בינה לבין סוף הדומיין.

לאחר מכן אם הוא מוצא עוד אחת הוא בודק כמה תווים זה בין שניהם.

ואז אתה יכל לדעת.

דוגמא:

קלט: hwzone.co.il

פלט: 2 2 6

סיווג: domain.xx.xx

קלט: hwzone.ru

פלט: 2 6

סיווג: domain.xx

קלט: hwzone.com

פלט: 3 6

סיווג: domain.xxx

וכו'

לגבי כתובות שהם IP אתה יכל לבדוק שיש שלוש נקודות ושכל מקטע הוא מספר.

קישור לתוכן
שתף באתרים אחרים

RFC זה Request For Comment.

הרבה מהתקנים של האינטרנט הם פשוט RFC שפורסם. אפשר למצוא אותם ברשת.

לדוגמא RFC 793 מגדיר את TCP (אם כי יש RFC נוספים עם תוספות ותיקונים).

קישור לתוכן
שתף באתרים אחרים

DNS הוא פרוטוקול מאוד מורכב ליישם ועד כמה שאני זוכר יש לו מספר לא קטן של RFCs.

אולי אני קצת איטי אבל אני לא מבין מה הבעיה פה, Zelig צדק לגבי זה שטכנית WWW זה לא חלק מהדומיין.

WWW זה השם של השרת (לרוב זה ה CNAME שלו ולא השם ה"אמיתי שלו ). וגם מה שבא אחרי ה "/" (כולל)

זה לא חלק מהדומיין אלא הקובץ והספרייה שאנחנו רוצים לקבל מהשרת.

לכן הנקודות לא אמורות להיות בעיה.

אגב טכנית בסוף של הכתובת צריכה להיות "." שמסמלת את ה root של DNS אבל לא נראה לי שהידע הזה יעזור לך...

קישור לתוכן
שתף באתרים אחרים

אני הייתי "הולך" לאורך המחרוזת משמאל לימין ואם החלק הראשון שלה יהיה WWW אני ימחק אותו (ואת ה ".")

ואז הייתי הולך שוב ובכל פעם שאני נתקל ב "." הייתי מוסיף 1 למשתנה מסיים (אני יקרא לו X ),

אם בסוף X יהיה 1 אז הדומיין הוא בסגנון CNN.COM אם X הוא 2 אז הוא בסגנון HWZONE.CO.IL וכו

קישור לתוכן
שתף באתרים אחרים

ארכיון

דיון זה הועבר לארכיון ולא ניתן להוסיף בו תגובות חדשות.

×
  • צור חדש...