[נפתר] זקוק עזרה מעכברי ה awk/sed/grep וכל מי שתותח בparsing של טקסט

פורסם 2010 באוקטובר 2814 שנים

אהלן,

יש לי קובץ HTML די מסובך של דף סטאטוס של tomcat. אני רוצה להוציא סטרינג מאוד מסויים ממנו לצרוך ניטור (מספר הטראדים הפעילים).

אם זה היה בvbscript הייתי פשוט מכין מחרוזת regex בסגנון של:

busy thread count: ([0-9])

ואז מבקש לקבל רק את ה occurrence ה-1 (כלומר המספר עצמו).

אני יודע שב sed למשל אני יכול לבטא את זה בעזרת \1 אבל אני רוצה להדפיס רק את הספרה, ולא את כל השורה המכילה את השורה...

בקיצור הנה דוגמא לחלק מהHTML:

<h1>JVM</h1><p> Free memory: 158.63 MB Total memory: 1021.50 MB Max memory: 1021.50 MB</p><h1>jk-172.16.1.16-8009</h1><p> Max threads: 200 Current thread count: 4 Current thread busy: 1<br> Max processing time: 0 ms Processing time: 0.0 s Request count: 0 Error count: 0 Bytes received: 0.00 MB Bytes sent: 0.00 MB</p><table border="0"><tr><th>Stage</th><th>Time</th><th>B Sent</th><th>B Recv</th><th>Client</th><th>VHost</th><th>Request</th></tr></table><p>P: Parse and prepare request S: Service F: Finishing R: Ready K: Keepalive</p><h1>http-172.16.1.16-8080</h1><p> Max threads: 300 Current thread count: 300 Current thread busy: 234<br> Max processing time: 186422 ms Processing time: 4855021.0 s Request count: 53299920 Error count: 117878 Bytes received: 46206.53 MB Bytes sent: 2049.89 MB</p><table border="0"><tr><th>Stage</th><th>Time</th><th>B Sent</th><th>B

אני רוצה לקבל חזרה רק 234. הכל דרך cli באובונטו.

רעיונות?

ציטוט

פורסם 2010 באוקטובר 2914 שנים

אני ארשום לך כמה אופציות.

אני יכול לעשות את זה יותר פשוט, אבל השאלה הכללית היא עד כמה דינמית השורה הזו (עד כמה היא עלולה להשתנות).

תבדוק את הדברים שעשיתי פה במצבים שונים לראות אם זה תמיד "תופס":

דוגמא א' (יוציא את ה 243 משתמש ב BUSY השני בכדי למצוא את המחרוזת)

sed 's/\ /\t/g'|sed 's/\t/\n/g' | sed -n '/busy/{n;p;}'|tail -n 1 | sed 's/<.*//g'

אם השורה הזו למשל נמצאת בקובץ myfile אתה עושה לפני כל השורה שלמעלה את :

cat myfile |

ואז מוסיף את מה שרשמתי.

דוגמא ב'

 sed 's/[a-zA-Z]\n/g' | sed -n '/bus/{n;p;}' | tail -n 1 | sed 's/<.*//g'

אותו העקרון, אני הלכתי על הדרך בה אני קודם מפרק את השורה האחת שלך לכמה שורות ואחרי זה כמה פקודות SED להוציא את הערך הרצוי.

דוגמא ג' בעזרת AWK:

awk {'print $73'} | sed 's/<.*//g'

רק צריך לשים לב שעם ה AWK שעשיתי זה הולך לפי רווחים וסופר עד הערך ב 73, אז אם הפורמט של השורה הזו משתנה, ה 73 שציינתי ב AWK לא יתאים לערך אותו אתה מחפש

נ.ב זה יעבוד לא רק באובונטו

מקוה שעזרתי...

בהצלחה!

ציטוט

פורסם 2010 באוקטובר 2914 שנים

מחבר

תודה נוריאל, אנסה את כולן ואנסה להבין איך אתה בונה את הparsing. רק חלק מהדגלים פה מוכר לי. (פרט לדוגמא האחרונה אבל גיליתי שזה לא התאים כי הדף דינאמי מדי).

ציטוט

פורסם 2010 באוקטובר 2914 שנים

תודה נוריאל, אנסה את כולן ואנסה להבין איך אתה בונה את הparsing. רק חלק מהדגלים פה מוכר לי. (פרט לדוגמא האחרונה אבל גיליתי שזה לא התאים כי הדף דינאמי מדי).

סבבה, מכיוון שאתה גם מעוניין להבין מה עשיתי שם (אני מאמין שיש דרכים "מתומצתות" יותר)

בשביל הטכניקה שהשתמשתי, הצטרכתי לפרק את השורה הארוכה הזו לכמה שורות, זאת עשיתי למשל בדוגמא ב' ע"י

's/[a-zA-Z]\n/g'

שאומר חפש כל אות (גדולה\קטנה) שאחריה מופיעות נקודותיים והחלף את אילו בשורה חדשה (n\).

אחרי זה אני מחפש את הערך busy או bus מכיוון שמופיע פעמיים אני עושה tail -n 1 כי הערך הרצוי מופיע אחרון.

אחרי זה תוספת sed "לנקות" את ה <br> ...

ציטוט

פורסם 2010 באוקטובר 3014 שנים

מחבר

חזק!

מנסיונך מתי SED ומתי AWK?

ציטוט

פורסם 2010 באוקטובר 3014 שנים

א. תלוי באיזה סינטקס אתה שולט יותר בשביל לבצע את מה שאתה צריך, בכל אופן גם לא רע לשלב sed ו awk באותה השורה \ סקריפט.

ב. לגבי מהירות עבודה, אני לא יודע מי מהם מהיר יותר, תריץ את הסקירפט שלך עם time לפני שם הסקריפט לראות כמה זמן, כך תוכל להשוות.

ויש לך את perl מה cmd:

perl -pe "/busy:[ ][0-9]{2,5}/; print \"Threads $&\n\";" myfile.html | head -n 1

אתה יכול לקרוא לזה מתוך סקריפט bash לדוגמא, מה שנחמד שהערך עצמו נכנס לתוך אחד המשתנים הדיפולטיים של perl ואתה יכול לעשות איתו הכל.

Perl אידיאלית ל text parsing

ציטוט

פורסם 2010 בנובמבר 114 שנים

מחבר

תודה נוריאל עזרת לי מאוד.

ציטוט

ארכיון

דיון זה הועבר לארכיון ולא ניתן להוסיף בו תגובות חדשות.

עבור לרשימת הדיונים

בעית קריאת שרת באנגולר
תכנות

בעית קריאת שרת באנגולר

פינגווין · לפני 15 שעות 15 שעות

אני עובדת עם אנגולר ו-C#. בקומפוננטה שלי אני מזמנת פונקציה מהסרוויס. כאשר הפונקציה בסרוויס היא סטטית- הכל עובד מצוין: מדפיס נתונים נכונים לקונסול ומוצגים הנתונים במסך הדפדפן. כאשר הפונקציה בסרוויס היא קריאת שרת אמיתית: מדפיס נתונים נכונים לקונסול (בדיוק אותו נתונים ואותו מבנה כמו בסטטי) ולא מוצגים נתונים במסך הדפדפן. החלק הסטטי של הקומפוננטה כן מוצג. כשאני מנסה להדפיס את המערך שקיבלתי מקריאת השרת, אז כמו שכבר ציינתי- זה מודפס לקונסול בצורה טובה עם ערכים נכונים, אך כאשר אני מנסה להדפיס את זה ב-ht
- 0 תגובות
- 158 צפיות
פינגווין

לפני 15 שעות 15 שעות

פינגווין

לפני 15 שעות 15 שעות
שדרוג מחשב גיימיניג בתקציב נמוך - 2500 ש"ח
ייעוץ לפני רכישת מחשב

שדרוג מחשב גיימיניג בתקציב נמוך - 2500 ש"ח

WereBunny · ביום שלישי בשעה 08:31 PM1 יום

הרבה זמן לא הייתי בפורום ואשמח לעזרתכם. את המחשב הנייח שלי שדרגתי לאחרונה לפני כעשור (אי שם כש-7870XT היה וואו), מאז עברתי לנייד Omen 15 עם 1660ti ומכיוון שסיימתי את הלימודים ויש לי מחשב של העבודה, הגיע הזמן לחזוור לימי הזוהר של מחשב נייח. ועכשיו לשאלון: 1. מה התקציב המירבי? האם מתאפשרת חריגה במידת הצורך? 2500 ש"ח, אם יש סיבה ממש טובה אפשר לחרוג ל-3000 ש"ח 2. מה שימושי המחשב (משחקים, עריכה גרפית, עבודה משרדית, תכני HD למשל), יש דוגמה ספציפית למשחק או תוכנה? גיימינג, קצת עריכה גרפית וקצת genera
- 4 תגובות
- 350 צפיות
WereBunny

ביום שלישי בשעה 08:31 PM1 יום

yoavke

לפני 18 שעות 18 שעות
זהירות: מודלים של שפה אפלה
כללי

זהירות: מודלים של שפה אפלה

Milford Cubicle · ביום שני בשעה 11:27 AM2 ימים

מודלים של בינה מלאכותית תוכננו ללא בקרות בטיחות מספקת או שונו באמצעות פריצות, כך חושף מחקר חדש שנערך באוניברסיטת בן גוריון בנגבלכתבה
- 0 תגובות
- 312 צפיות
Milford Cubicle

ביום שני בשעה 11:27 AM2 ימים

Milford Cubicle

ביום שני בשעה 11:27 AM2 ימים
היי חברים שאלה על GTA
משחקי מחשב

היי חברים שאלה על GTA

Beny Yanko · ביום ראשון בשעה 07:10 AM3 ימים

ראיתי את המשחק הזה שכולנו מחכים לו כבר הרבה זמן: https://hwzone.co.il/main-games/%d7%99%d7%a9-%d7%aa%d7%90%d7%a8%d7%99%d7%9a-gta-vi-%d7%a7%d7%99%d7%91%d7%9c-%d7%aa%d7%90%d7%a8%d7%99%d7%9a-%d7%a9%d7%97%d7%a8%d7%95%d7%a8-%d7%a8%d7%a9%d7%9e%d7%99-%d7%90%d7%91%d7%9c-%d7%99%d7%a9/ רציתי לדעת אם הוא יגיע גם למחשב או רק לפלייסטיישן והאם כדאי לקנות מראש? תודה חברים!
- 1 תגובה
- 814 צפיות
Beny Yanko

ביום ראשון בשעה 07:10 AM3 ימים

Milford Cubicle

ביום שני בשעה 03:17 PM2 ימים
מחשב נייד לגיימינג - כדאי לבדוק
ייעוץ לפני רכישת מחשב

מחשב נייד לגיימינג - כדאי לבדוק

A-10 · ביום שבת בשעה 06:55 PM4 ימים

היי מביא כאן המלצה למחשב גיימינג נייד. https://www.youtube.com/watch?v=lotIrC6zzmU תראו אולי מתאים למי מכם ...
- 0 תגובות
- 3,914 צפיות
A-10

ביום שבת בשעה 06:55 PM4 ימים

A-10

ביום שבת בשעה 06:55 PM4 ימים