Programowanie > Inne

parsowanie plikow

(1/1)

1709:
Zrobiłem sobie plik


--- Kod: ---
wget "https://www.dropbox.com/sh/8kq9gxdu5krmipb/YdLGo4-El7/pliki/AppCool" --output-document=test.xml
--- Koniec kodu ---
coś w rodzaju xml, ale nie do końca jest to xml.

Próbowałem na początku użyć xmllint --shell conf.xml
ale z powyższego powodu się sypie.
Za pomocą " grep " ładnie sobie wyszukałem linie do parsowania
ale dalej mam problem  

--- Kod: ---
$j("#pyxl6512436918313739892").text("AppCool-v.2.tar.xz".em_snippet(40, 0.750000));
--- Koniec kodu ---
1. ) Czy jest jakiś sposób by wydobyć słowo w drugim cudzysłowie?
Sposób maskowania cudzysłowia """" dla cut nie działa
sed'a i awk'a nie znam a man chyba raczej nie strawie, jeśli wogóle coś strawie,
ponieważ jest to na tyle ciężkie że potrzebuje widzieć przykłady jak to działa.

2. ) chciałbym wydobyć linki z bardzo dlugiej linijki xml,
które są w nawiasach zaraz za

--- Kod: ---
div class="filename-col">

Nawigacja

[0] Indeks wiadomości

Idź do wersji pełnej