Përdoruesi:OlsiBot/Importimi automatik i artikujve
Kjo faqe u vjen në ndihmë përdoruesve të cilët kanë njohje të avancuar mbi strukturën dhe funksionimin e Wikipedias. Në qoftë se ju nuk dini ende të redaktoni një faqe mund tia filloni këtu, në qoftë se nuk dini se si krijohet një artikull fillojani këtu. Hapat e mëposhtëm janë më kompleksë dhe jo vetëm që kërkojë të keni përvojë në Wikipedia, por edhe në gjuhët e programimit Python, PHP etj.
Importimi automatik i artikujve është një funksion shumë i dobishëm në Wikipedia. Kështu mund ti kursejmë vetes kohë dhe energji. Dobia e "impotimit automatik" shfaq gjithë potencialin e saj në rastin e artikujve që lidhen nga e njëjta temë. Përpara se të futemi në hollësi; duhet të dini se ky nuk është një funksion i brëndshëm i Wikipedias, por realizohet përmes mjeteve të jashtme siç janë robotët. Ekzistojnë disa platforma robotësh që kryejnë këtë funksion, por më poshtë do të përmëndet vetëm platforma e robotëve në gjuhën Python që operojnë përmes pywikipedia framework, mënyrë që është testuar edhe më parë në Wikipedian në shqip përmes Robotit Tung. Për të njohur më tej platformën e robotëve pywikipedia vizitoni faqen Botwiki.
Grumbullimi i të dhënave
[Redakto | Redakto nëpërmjet kodit]Për të krijuar një artikull të ri detyrimisht që do të kemi nevojë për të dhënat (informacionin). Informacioni i grumbulluar më pas duhet të listohet. Një mënyrë se si të listoni informacionin e grumbulluar përshkruhet më poshtë. Hapni programin Microsoft Excel dhe krijoni një tablë; ku çdo rresht do të përfaqësojë artikullin me informatat ndërsa çdo kollonë grupin e informatave.
Për shëmbull; do të krijojmë një listë me artikuj të rinj për komunat në qarkun Botoşani në Rumani. Informacioni për të cilin kemi nevojë përfshin: koordinatat gjeografike, popullsinë, sipërfaqen, lartësinë, kodin postar, numrin e fshatrave dhe vetë fshatrat. Informacioni mbi shtetin dhe qarkun është i përbashkët dhe nuk është i nevojshëm të shënohet në këtë hap. Një mënyrë e lehtë për të grumbulluar informacion në këtë rast do të ishte nga Wikipeditë homologe, por mund të shfrytëzohen edhe faqe specifike si:
- http://www.statoids.com/
- http://www.fallingrain.com/world/
- http://www.world-gazetteer.com/
- http://www.citypopulation.de/
Mbledhja e informacionit në këtë rast është manual. Në programin MS Excel ju do të krijoni një tabelë si më poshtë.
Një mënyrë tjetër për të grumbulluar informacion në formë tabelare është përmes templatetiger. Ja një shëmbull ku listohen të gjithë artikujt që ka Wikipedia italiane për vendbanimet në Shqipëri https://toolserver.org/~kolossos/templatetiger/tt-table4.php?lang=itwiki&template=Divisione%20amministrativa&where=Stato&is=ALB&&offset=0&limit=1000.
Hapi i parë
[Redakto | Redakto nëpërmjet kodit]Artikulli | gjer_G | gjer_M | gjer_S | gjer_DR | gjat_G | gjat_M | gjat_S | gjat_DR | Pop. | Sip. | Kodi | Nr. | Fshatrat | Harta foto |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Adăşeni | 48 | 4 | 0 | N | 26 | 56 | 0 | E | 6871 | 97,56 | 717005 | 6 | Albeşti, Buimăceni, Costiugeni, Jijia, Măşcăteni, Tudor Vladimirescu | Albesti jud Botosani.png |
Albeşti (Botoşani) | 47 | 42 | 0 | N | 27 | 4 | 0 | E | 1556 | 22,80 | 717016 | 2 | Adăşeni dhe Zoiţani | |
Avrămeni | 48 | 1 | 0 | N | 26 | 57 | 0 | E | 3841 | 111,40 | 717015 | 7 | Aurel Vlaicu, Avrămeni, Dimitrie Cantemir, Ichimeni, Panaitoaia, Timuş, Tudor Vladimirescu | Avrameni jud Botosani.png |
- Artikulli - përfaqëson titullin ekzakt të artikullit që do të krijojmë.
- gjer_X dhe gjat_Y - përfaqësojnë koordinatat gjeografike të komunës (në rastin tonë).
- Pop. - Pupullsia e komunës.
- Sip. - Sipërfaqja e komunës.
- Kodi - Kodi postar i komunës.
- Nr. - Numri i fshatrave të komunës.
- Fshatrat - Fshatrat e komunës.
- Harta foto - Figurë e hartës së komunës.
Hapi i dytë
[Redakto | Redakto nëpërmjet kodit]Deri më tani kemi krijuar një dokument me të dhënat më të nevojshme në formatin .xls ose .xlsx, i cili nuk është formati përfundimtar nga ku do të shfrytëzohen të dhënat. Formati përfundimtar do të jetë .txt (pra vetëm tekst i thjeshtë).
Robotët vërtet janë të shpejtë e të dobishëm, por kjo nuk do të thotë se janë të zgjuar. Tabela e mësipërme mund të interpretohet fare lehtë prej çdo njeriu, por jo prej robotit. Do të duhet që këtë tabelë ta ndërtojmë në atë mënyrë që ta interpretojë edhe roboti. Të gjitha informacionet që kemi listuar për ne quhen vlera, në mënyrë që roboti ti lexojë duhet ti lidhim me një çelës parametrik; kështu | parametri = vlera
.
Adăşeni | | gjer_G = | 48 | | gjer_M = | 4 | | gjer_S = | 0 | | gjer_DR = | N | | gjat_G = | 26 | | gjat_M = | 56 | | gjat_S = | 0 | | gjat_DR = | E | | pop = | 6871 | | sip = | 97,56 | | kodi = | 717005 | | nr = | 6 | | fshatrat = | Albeşti, Buimăceni, Costiugeni, Jijia, Măşcăteni, Tudor Vladimirescu | | harta = | Albesti jud Botosani.png |
Albeşti (Botoşani) | | gjer_G = | 47 | | gjer_M = | 42 | | gjer_S = | 0 | | gjer_DR = | N | | gjat_G = | 27 | | gjat_M = | 4 | | gjat_S = | 0 | | gjat_DR = | E | | pop = | 1556 | | sip = | 22,80 | | kodi = | 717016 | | nr = | 2 | | fshatrat = | Adăşeni dhe Zoiţani | | harta = | |
Avrămeni | | gjer_G = | 48 | | gjer_M = | 1 | | gjer_S = | 0 | | gjer_DR = | N | | gjat_G = | 26 | | gjat_M = | 57 | | gjat_S = | 0 | | gjat_DR = | E | | pop = | 3841 | | sip = | 111,40 | | kodi = | 717015 | | nr = | 7 | | fshatrat = | Aurel Vlaicu, Avrămeni, Dimitrie Cantemir, Ichimeni, Panaitoaia, Timuş, Tudor Vladimirescu | | harta = | Avrameni jud Botosani.png |
Siç mund ta vini re tabela filloi tu ngjajë stampave ku ne përcaktojmë një vlerë për çdo parametër.
Hapi i tretë
[Redakto | Redakto nëpërmjet kodit]Deri tani i kemi përcaktuar robotit se cilat janë vlerat përmes parametrave, por nuk i kemi përcaktuar:
- titullin e vetë artikullit:
- Në mënyrë që të përcaktojmë titullin e artikullit duhet të që atë ta vendosim brënda thonjëzave treshe, kështu:
'''Titulli'''
.
- ku fillojnë dhe ku mbarojnë vlerat e një artikulli:
- Në mënyrë që të përcaktojmë se ku fillon një artikull vendosim 4 x-a kështu,
xxxx
ndërsa për të përcaktuar se ku mbaron vendosim 4 y-a atje ku mbaron, kështuyyyy
.
- faqen shëmbull sipas së cilës të krijojë faqet e tjera:
- Në mënyrë që ti përcaktojmë faqen shëmbull ne duhet ta krijojmë një faqe të tillë. Në këtë rast si faqe shëmbull po përdorim Përdoruesi:Roboti Tung/Faqja shëmbull. Në mënyrë që roboti ti përdorë vlerat e tabelës duhet që të përdorim funksionin
{{subst: ...}}
. Veprojmë kështu: pas thonjëzave mbyllëse që përcaktojnë titullin dhe para se të fillojë| parametri i parë
shtojmë një kolonë të re dhe vendosim{{subst:Faqja shëmbull
. Në fund të parametrit të fundit por para 4 y-aveyyyy
vendosim}}
kllapat mbyllëse të funksionit{{subst}}
.
xxxx''' | Adăşeni | '''{{subst: Përdoruesi:Roboti Tung/Faqja shëmbull | | gjer_G = | 48 | | gjer_M = | 4 | | gjer_S = | 0 | | gjer_DR = | N | | gjat_G = | 26 | | gjat_M = | 56 | | gjat_S = | 0 | | gjat_DR = | E | | pop = | 6871 | | sip = | 97,56 | | kodi = | 717005 | | nr = | 6 | | fshatrat = | Albeşti, Buimăceni, Costiugeni, Jijia, Măşcăteni, Tudor Vladimirescu | | harta = | Albesti jud Botosani.png | }}yyyy |
xxxx''' | Albeşti (Botoşani) | '''{{subst: Përdoruesi:Roboti Tung/Faqja shëmbull | | gjer_G = | 47 | | gjer_M = | 42 | | gjer_S = | 0 | | gjer_DR = | N | | gjat_G = | 27 | | gjat_M = | 4 | | gjat_S = | 0 | | gjat_DR = | E | | pop = | 1556 | | sip = | 22,80 | | kodi = | 717016 | | nr = | 2 | | fshatrat = | Adăşeni dhe Zoiţani | | harta = | }}yyyy | |
xxxx''' | Avrămeni | '''{{subst: Përdoruesi:Roboti Tung/Faqja shëmbull | | gjer_G = | 48 | | gjer_M = | 1 | | gjer_S = | 0 | | gjer_DR = | N | | gjat_G = | 26 | | gjat_M = | 57 | | gjat_S = | 0 | | gjat_DR = | E | | pop = | 3841 | | sip = | 111,40 | | kodi = | 717015 | | nr = | 7 | | fshatrat = | Aurel Vlaicu, Avrămeni, Dimitrie Cantemir, Ichimeni, Panaitoaia, Timuş, Tudor Vladimirescu | | harta = | Avrameni jud Botosani.png | }}yyyy |
Hapi i katërt
[Redakto | Redakto nëpërmjet kodit]Meqë më lart thamë se roboti nuk e njeh formatin .xls atëherë duhet që këtë databazë ta ruajmë në formatin .txt. Kopjoje të gjithë databazën, përdor këtë faqe për të larguar hapësirat boshe dhe në fund ruaje përmajtjen në formatin txt me kodim UTF-8 (Encoding: UTF-8). Me kaq kemi përfunduar skedarin i cili është gati të përdoret prej robotit.
xxxx'''Adăşeni'''{{subst: Përdoruesi:Roboti Tung/Faqja shëmbull| gjer_G =48| gjer_M =4| gjer_S =0| gjer_DR =N| gjat_G =26| gjat_M =56| gjat_S =0| gjat_DR =E| pop =6871| sip =97,56| kodi =717005| nr =6| fshatrat =Albeşti, Buimăceni, Costiugeni, Jijia, Măşcăteni, Tudor Vladimirescu| harta =Albesti jud Botosani.png}}yyyy xxxx'''Albeşti (Botoşani)'''{{subst: Përdoruesi:Roboti Tung/Faqja shëmbull| gjer_G =47| gjer_M =42| gjer_S =0| gjer_DR =N| gjat_G =27| gjat_M =4| gjat_S =0| gjat_DR =E| pop =1556| sip =22,80| kodi =717016| nr =2| fshatrat =Adăşeni dhe Zoiţani| harta =}}yyyy xxxx'''Avrămeni'''{{subst: Përdoruesi:Roboti Tung/Faqja shëmbull| gjer_G =48| gjer_M =1| gjer_S =0| gjer_DR =N| gjat_G =26| gjat_M =57| gjat_S =0| gjat_DR =E| pop =3841| sip =111,40| kodi =717015| nr =7| fshatrat =Aurel Vlaicu, Avrămeni, Dimitrie Cantemir, Ichimeni, Panaitoaia, Timuş, Tudor Vladimirescu| harta =Avrameni jud Botosani.png}}yyyy
Importimi automatik
[Redakto | Redakto nëpërmjet kodit]Gjithë procesi i mësipër u realizua manualisht, tani është rradha e robotit të krijojë automatikisht artikuj nga skedari i krijuar prej nesh. Importimi automatik i artikujve në Wikipedian në shqip është realizuar edhe më parë prej Robotit Tung. Në qoftë se keni krijuar skedarin .txt dhe dëshironi të krijoni artikuj të automatizuar më lini në njoftim në faqen time të diskutimit Përdoruesi diskutim:Euriditi dhe unë do të drejtoj robotin ti krijojë.
Artikujt që dëshironim të krijonim Adăşeni, Albeşti (Botoşani), Avrămeni u krijuan automatikisht prej Robotit Tung. Për lehtësi të guidës u përdorën 3 artikuj, por ju mund të përdorni aq artikuj sa dëshironi. Zakonisht ky funksion shërben për që krijuar artikuj në masë, disa qindra apo mijëra artikuj përnjëherë.
- Kodi i ekzekutimit
pagefromfile.py -notitle -start:xxxx -end:yyyy -file:text.txt
Argumentet e pagefromfile.py |