Si të përdorni komandën wget Linux për të shkarkuar faqet dhe skedarët e uebit

Utility wget ju lejon të shkarkoni faqet e internetit, skedarët dhe imazhet nga interneti duke përdorur linjen e komandës Linux.

Ju mund të përdorni një komandë të vetme wget për të shkarkuar nga një vend ose të krijoni një skedar të hyrjes për të shkarkuar skedarë të shumëfishta nëpër faqet e shumëfishta.

Sipas faqeve manuale wget mund të përdoret edhe kur përdoruesi ka dalë nga sistemi. Për ta bërë këtë ju do të përdorni komandën nohup.

Utility wget do të rifillojë një shkarkim edhe kur lidhja të bjerë, duke vazhduar nga ku ka ndërprerë nëse është e mundur kur lidhja kthehet.

Ju mund të shkarkoni të gjitha faqet e internetit duke përdorur wget dhe të konvertohet lidhjet për të treguar në burimet lokale në mënyrë që ju të mund të shihni një faqe interneti jashtë linje.

Tiparet e wget janë si më poshtë:

Si ta shkarkoni një faqe interneti duke përdorur wget

Për këtë udhëzues, unë do t'ju tregoj se si ta shkarkoni blogun tim personal.

wget www.everydaylinuxuser.com

Vlen të krijoni dosjen tuaj në kompjuterin tuaj duke përdorur komandën mkdir dhe pastaj duke lëvizur në dosje duke përdorur komandën cd .

Për shembull:

mkdir everydaylinuxuser
cd everydaylinuxuser
wget www.everydaylinuxuser.com

Rezultati është një skedar i vetëm index.html. Në vete, kjo skedar është mjaft e padobishme pasi përmbajtja është tërhequr ende nga Google dhe imazhet dhe stilet janë ende të mbajtura në Google.

Për të shkarkuar faqen e plotë dhe të gjitha faqet që mund të përdorni komandën e mëposhtme:

wget -r www.everydaylinuxuser.com

Kjo shkarkon faqet në mënyrë rekursive deri në një maksimum prej 5 nivelesh të thella.

5 nivele të thella nuk mund të jenë të mjaftueshme për të marrë gjithçka nga faqja. Ju mund të përdorni çelësin -l për të vendosur numrin e niveleve që dëshironi të shkoni në të mëposhtmet:

wget -r -l10 www.everydaylinuxuser.com

Nëse doni rekursion të pafund ju mund të përdorni sa vijon:

wget -r -l inf www.everydaylinuxuser.com

Ju gjithashtu mund të zëvendësoni inf me 0 që do të thotë të njëjtën gjë.

Ka ende një problem tjetër. Ju mund të merrni të gjitha faqet në nivel lokal, por të gjitha lidhjet në faqe ende tregojnë vendin e tyre origjinal. Prandaj nuk është e mundur të klikoni në nivel lokal në mes të lidhjeve në faqe.

Ju mund të merrni rreth këtij problemi duke përdorur switch -k që konverton të gjitha lidhjet në faqet për të treguar në ekuivalentin e tyre të shkarkuar lokalisht si më poshtë:

wget -r -k www.everydaylinuxuser.com

Nëse dëshironi të merrni një pasqyrë të plotë të një faqeje interneti, thjesht mund të përdorni kalimin e mëposhtëm që heq domosdoshmërinë e përdorimit të ndërfaqeve -r -k dhe -l.

wget -m www.everydaylinuxuser.com

Prandaj, nëse keni faqen tuaj personale ju mund të bëni një kopje të plotë duke përdorur këtë komandë të thjeshtë.

Run wget si një komandë sfondi

Ju mund të merrni wget për të kandiduar si një komandë sfond duke ju lënë në gjendje të merrni më me punën tuaj në dritaren e terminalit ndërsa fotografi shkarko.

Thjesht përdorni komandën e mëposhtme:

wget -b www.everydaylinuxuser.com

Ju mund të kombinoni ndërprerës. Për të drejtuar komandën wget në sfond duke pasqyruar faqen, ju do të përdorni komandën e mëposhtme:

wget -b -m www.everydaylinuxuser.com

Ju mund ta thjeshtoni këtë më tej si më poshtë:

wget -bm www.everydaylinuxuser.com

prerje-transportim trupash

Nëse po e drejtoni komandën wget në sfond, nuk do të shihni asnjë nga mesazhet normale që dërgon në ekran.

Ju mund t'i merrni të gjitha ato mesazhe të dërguara në një skedar log në mënyrë që të kontrolloni progresin në çdo kohë duke përdorur komandën e bishtit .

Për të nxjerrë informacion nga komanda wget në një skedar log, përdorni komandën e mëposhtme:

wget -o / path / to / mylogfile www.everydaylinuxuser.com

E kundërta, sigurisht, është që të mos kërkohet asnjë prerje dhe nuk ka dalje në ekran. Për të hequr të gjitha daljet përdorni komandën e mëposhtme:

wget -q www.everydaylinuxuser.com

Shkarkoni nga faqet e shumëfishta

Ju mund të krijoni një skedar hyrjeje për të shkarkuar nga shumë vende të ndryshme.

Hapni një skedar duke përdorur redaktorin tuaj të preferuar ose edhe komandën e maceve dhe thjesht filloni të renditni faqet ose lidhjet për shkarkim nga çdo rresht i skedarit.

Ruani skedarin dhe pastaj afishoni komandën e mëposhtme wget:

wget -i / path / to / inputfile

Përveç mbështetjes së faqes suaj të internetit ose gjetjes së diçkaje për të shkarkuar për të lexuar në tren, nuk ka gjasa që do të dëshironi të shkarkoni një faqe të tërë.

Ju keni më shumë gjasa të shkarkoni një URL të vetme me imazhe ose ndoshta shkarkoni skeda si skedarët zip, skedarët ISO ose skedarët imazhit.

Me këtë në mendje ju nuk dëshironi të keni të shkruani në vijim në skedarin e futjes pasi që është koha që konsumon:

Nëse e dini që URL-ja bazë gjithmonë do të jetë e njëjtë, mund të specifikoni sa më poshtë në dosjen e hyrjes:

Ju pastaj mund të sigurojë URL bazë si pjesë e komandës wget si më poshtë:

wget -B http://www.myfileserver.com -i / path / to / inputfile

Përsëritni opsionet

Nëse keni ngritur një radhë fotografi për tu shkarkuar brenda një skedari të dhënash dhe e lëshoni kompjuterin tuaj drejtimin e gjithë natës për të shkarkuar skedarët që do të mërziteni mjaftueshëm kur të zbrisni në mëngjes për të gjetur se është mbërthyer në dosjen e parë dhe është duke u përpjekur gjithë natën.

Ju mund të specifikoni numrin e përpjekjeve duke përdorur kalimin e mëposhtëm:

wget -t 10 -i / path / to / inputfile

Ju mund të dëshironi të përdorni komandën e mësipërme në lidhje me -T kaloni që ju lejon të specifikoni një timeout në sekonda si vijon:

wget -t 10 -T 10 -i / path / to / inputfile

Komanda e mësipërme do të tentojë sërish 10 herë dhe do të përpiqet të lidhet për 10 sekonda për secilën lidhje në skedar.

Është gjithashtu mjaft i bezdisshëm kur ju keni shkarkuar pjesërisht 75% të një skedari 4 gigabajt në një lidhje të ngadaltë broadband vetëm për lidhjen tuaj për t'u larguar.

Ju mund të përdorni wget për të provuar nga ku u ndalua shkarkimi duke përdorur komandën e mëposhtme:

wget -c www.myfileserver.com/file1.zip

Nëse po goditni një server, hosti nuk mund të pëlqejë shumë dhe mund të bllokojë ose thjesht të vrasë kërkesat tuaja.

Ju mund të specifikoni një periudhë të pritjes e cila specifikon sa kohë duhet të presë midis çdo rikthim si më poshtë:

wget -w 60 -i / path / to / inputfile

Komanda e mësipërme do të presë 60 sekonda ndërmjet çdo shkarkimi. Kjo është e dobishme nëse shkarkoni shumë skedarë nga një burim i vetëm.

Disa web host mund të vërejnë frekuencën megjithatë dhe do t'ju bllokojnë gjithsesi. Ju mund ta bëni periudhën e pritjes të rastësishme për ta bërë atë të duket sikur nuk po përdorni një program si më poshtë:

wget - rast-pritje -i / path / to / inputfile

Mbrojtja e kufijve të shkarkimit

Shumë ofrues të shërbimeve të internetit ende aplikojnë kufijtë e shkarkimit për përdorimin tuaj të broadband, veçanërisht nëse jetoni jashtë një qyteti.

Ju mund të dëshironi të shtoni një kuotë në mënyrë që të mos fryni atë limit të shkarkimit. Këtë mund ta bëni në mënyrën e mëposhtme:

wget -q 100m -i / path / to / inputfile

Vini re se komanda -q nuk do të funksionojë me një skedar të vetëm.

Pra, nëse shkarkoni një skedar që është 2 gigabajt në madhësi, përdorimi i -q 1000m nuk do të ndalojë shkarkimin e skedarit.

Kuota zbatohet vetëm kur shkarkohen në mënyrë rekursive nga një vend ose kur përdoret një skedar i futjes.

Përmes Sigurimit

Disa faqe kërkojnë që të identifikoheni për të hyrë në përmbajtjen që dëshironi të shkarkoni.

Ju mund të përdorni çelësat e mëposhtëm për të specifikuar emrin e përdoruesit dhe fjalëkalimin.

wget - user = yourusername --password = yourpassword

Shënim mbi një sistem shumë përdorues nëse dikush drejton komandën ps ata do të jenë në gjendje të shohin emrin dhe fjalëkalimin tuaj.

Opsionet e tjera të shkarkimit

By default kaloni -r do ricursive shkarkojë përmbajtjen dhe do të krijojë directories si ajo shkon.

Ju mund të merrni të gjitha skedarët për tu shkarkuar në një dosje të vetme duke përdorur kalimin e mëposhtëm:

wget -nd -r

E kundërta e kësaj është të detyrojë krijimin e drejtorive që mund të arrihen duke përdorur komandën e mëposhtme:

wget -x -r

Si të shkarkoni disa lloje të skedarëve

Nëse dëshironi të shkarkoni në mënyrë rekurente nga një vend, por dëshironi vetëm të shkarkoni një lloj skedari të caktuar si një mp3 ose një imazh, si png, ju mund të përdorni sintaksën e mëposhtme:

wget -A "* .mp3" -r

E kundërta e kësaj është të injorosh skedarë të caktuar. Ndoshta nuk doni të shkarkoni ekzekutuesit. Në këtë rast, do të përdorni sintaksën e mëposhtme:

wget -R "* .exe" -r

cliget

Ka një shtesë Firefox-i që quhet cliget. Ju mund të shtoni këtë në Firefox në mënyrën e mëposhtme.

Vizito https://addons.mozilla.org/en-US/firefox/addon/cliget/ dhe kliko butonin "add to Firefox".

Klikoni butonin e instalimit kur të shfaqet. Ju do të kërkohet që të rinisni Firefox-in.

Për të përdorur cliget vizitoni një faqe ose skedar që dëshironi të shkarkoni dhe klikoni me të djathtën. Një menu kontekst do të shfaqet quajtur cliget dhe do të ketë opsione për të "kopjuar në wget" dhe "copy to curl".

Klikoni opsionin "copy to wget" dhe hapni një dritare të terminalit dhe pastaj klikoni me të djathtën dhe ngjiteni. Komanda e duhur wget do të ngjitet në dritare.

Në thelb, kjo ju kursen që duhet të shkruani vetë komandën.

përmbledhje

Komanda wget si një numër i madh opsionesh dhe çelsash.

Vlen, pra, të lexoni faqen manuale për wget duke shtypur në vijim në një dritare terminali:

njeriu wget