Nowe posty

xx Dystrybucja pod HP Omen (6)
Wczoraj o 23:30:08
xx [Poradnik] Wyszukiwanie Sterowników (2)
Wczoraj o 21:08:23
lamp Problem z Linux Lite po instalacji (0)
Wczoraj o 19:50:30
xx Ile pingwinów? (1)
Wczoraj o 08:59:24
xx konfiguracja pale moon (0)
2024-03-24, 21:53:42
xx Plasma 6 w Neonie ssie trochę mniej ... (10)
2024-03-23, 02:38:11
xx problem z instalacja sterowników do karty sieciowej (3)
2024-03-18, 18:10:16
xx Plik abc.001 (1)
2024-03-17, 17:48:27
xx Zlecę dopracowanie programu w MatLab (0)
2024-03-13, 15:28:40
xx Linux Mint 21.3 XFCE brak dźwieku po paru minutach (karta muzyczna zintegrowana) (5)
2024-03-12, 23:07:01

Autor Wątek: problem z cut  (Przeczytany 4245 razy)

Night_Kn8

  • Gość
problem z cut
« dnia: 2008-03-13, 10:27:16 »
witam! mam pewien problem z "zadaniem domowym" otóż kazano mi wyciągnąć w (systemie winXP.) z przykładowej zapisanej na dysku stronie internetowej: adresy e-mail. Dano mi do tego narzędzia takie same jak w Ujnixie, i po wielu... nieudanych próbach! piszę w końcu w konsoli:

C:\\###\\#####....>ls -la | grep "mailto" stronajakas.htm | cut -d ">" -f2  

i otrzymuje taki oto wynik:




moje pytanie brzmi:
co powinienem zrobić aby dostać same  adresy e-mail, bez niepotrzebnych ciągów znaków?, gdyż nie mogę się ich pozbyć!,

no i może (jeśli to możliwe) jak zapisać wyizolowane adresy mail do osobnego pliku? (czy zrobić to "funkcją" cat, czy w jakiś inny sposób)

Dziękuje za udzieloną odpowiedź początkującemu użytkownikowi :D ! Pozdrawiam

norbert_ramzes

  • Gość
problem z cut
« Odpowiedź #1 dnia: 2008-03-13, 10:54:32 »
Jest coś takiego jak wyrażenia regularne.

Ew. można by się obyć bez nich i wykorzystać dosłownie kilka funkcji dostępnych w php.

Night_Kn8

  • Gość
problem z cut
« Odpowiedź #2 dnia: 2008-03-13, 12:49:07 »
utworzyłem dokument html i wpisałem do niego dane:
============
march_ewka
kot
28widelcy
xxx@xxx.pl
e-mail: yyy@yyy.pl
=============
doszedłem do czegoś takiego:
cat stronkainternetowa.htm | grep "[:graph:]@[[:alnum:]].[[:alpha:]]

co prawda wyświetla mi maila, ale jak jest na początku każdej linii  czyli w tym wypadku wyświetli mi: xxx@xxx.pl, a zignoruje yyy@yyy.pl gdyż poprzedza go napis "e-mail:". Czy może wie ktoś co mam zrobić aby wyświetlał mi również adresy w środku tekstów?

chmooreck

  • Gość
problem z cut
« Odpowiedź #3 dnia: 2008-03-13, 14:31:31 »
a co jeśli adres mailowy będzie miał postać:
aa.a@a.a.a.pl ? ;-)

Night_Kn8

  • Gość
problem z cut
« Odpowiedź #4 dnia: 2008-03-14, 08:37:18 »
Cytat: chmooreck
a co jeśli adres mailowy będzie miał postać:
aa.a@a.a.a.pl ? ;-)
bez znaczenia, bo działa to równie dobrze na com.pl jak i na samym pl. (sprawdzałem ten fakt, dlatego nic nie poprawiłem)

może ktoś wie jednak jak wyciąć kawałek z środka linii i nie do niej końca, bo nie mogę do tego dojść, chce uzyskać z postaci:
blablabalblab.....XXX@XXX.xxxblablablabla....
postac:
XXX@XXX.xxx
Polecenie cut owszem działa, ale nie wiem jak ciąć obustronnie. Ja chciałem określić wycinek od znaku : do <  i resztę maila grep-em wyciągnąć, nie wiem, jak narazie nie udaje mi się nic zrobić, no ale próbuje, proszę innych o pomoc i dziękuje za jej udzielenie. Pozdrawiam

norbert_ramzes

  • Gość
problem z cut
« Odpowiedź #5 dnia: 2008-03-14, 11:52:25 »
Ja bym to zrobił tak albo tak.