Achtung! Im Script sind postingbedingt noch Zeilenumbrüche drin die
vorher raus müssen.
Ausserdem auf permantente Cookies achten, sonst macht wget Probleme.
Neuer Versuch ohne Zeilenumbrüche, dafür müssen die > am Anfang
entfernt werden:
/bin/grep schrieb am 29. Oktober 2008 12:48
> #!/bin/bash
>
> # Datei mit den beiden Heise-Cookies (notwendig für login)
> COOKIEFILE=cookies.txt
>
> # Nummer des ersten runterzuladenden Beitrags (0=der aktuellste)
> POST=0
>
> # Nummer des ältesten noch runterzuladenden Beitrags
> MAXPOST=1650
>
> # eure Usernummer. Findet ihr in der URL der Liste der eigenen Beiträge im Forenprofil.
> USERNR=xxxxx
>
> echo
> echo "Schritt 1: Laden der Beitragslisten"
> echo
> while [ $POST -lt $MAXPOST ]; do
> printf -v HTML "postlist-%04d.html" $POST
> echo wget --load-cookies $COOKIEFILE -O $HTML http://www.heise.de/extras/foren/user_postings/user-${USERNR}/hs-${POST}/
> sed -n '\/foren\/S-.*\/read\// s#.*href="\([^"]*\).*#\1#p' $HTML >> postlist.txt
> POST=$(( POST + 16 ))
> done
>
> echo
> echo "Schritt 2: Laden der einzelnen Beiträge"
> echo
> sort postlist.txt | uniq | while read line; do
> wget --load-cookies $COOKIEFILE -x -N http://www.heise.de$line;
> done
vorher raus müssen.
Ausserdem auf permantente Cookies achten, sonst macht wget Probleme.
Neuer Versuch ohne Zeilenumbrüche, dafür müssen die > am Anfang
entfernt werden:
/bin/grep schrieb am 29. Oktober 2008 12:48
> #!/bin/bash
>
> # Datei mit den beiden Heise-Cookies (notwendig für login)
> COOKIEFILE=cookies.txt
>
> # Nummer des ersten runterzuladenden Beitrags (0=der aktuellste)
> POST=0
>
> # Nummer des ältesten noch runterzuladenden Beitrags
> MAXPOST=1650
>
> # eure Usernummer. Findet ihr in der URL der Liste der eigenen Beiträge im Forenprofil.
> USERNR=xxxxx
>
> echo
> echo "Schritt 1: Laden der Beitragslisten"
> echo
> while [ $POST -lt $MAXPOST ]; do
> printf -v HTML "postlist-%04d.html" $POST
> echo wget --load-cookies $COOKIEFILE -O $HTML http://www.heise.de/extras/foren/user_postings/user-${USERNR}/hs-${POST}/
> sed -n '\/foren\/S-.*\/read\// s#.*href="\([^"]*\).*#\1#p' $HTML >> postlist.txt
> POST=$(( POST + 16 ))
> done
>
> echo
> echo "Schritt 2: Laden der einzelnen Beiträge"
> echo
> sort postlist.txt | uniq | while read line; do
> wget --load-cookies $COOKIEFILE -x -N http://www.heise.de$line;
> done