Scrapping mudah dengan PyQuery

Inget dulu waktu scrapping menggunakan PHP cURL, harus setting ini, itu ono. Terus ketika hasil scrapping didapat, pecahin satu-satu tag nya. Cari value nya, posting dulu ajax nya, dan bla bla bla…

Ngobol sama temen, mending pake Python aja bro, cepet n gampang, ga sulit, banyak tool nya lagi. Bisa pake BeautifulSoup, PyQuery, Request, atau bawaan python. Akhirnya nyobain juga, pertama pake Request. Setelah itu nyobain pake PyQuery karena simple banget doc nya dibanding mesti liat doc Beautifulsoup. Pas nyobain,,brrrr, enyyyyakkk bener! rasa jquery bgt 😀

PyQuery bisa lihat-lihat doc nya di page ini https://pypi.python.org/pypi/pyquery

Awalnya, install dulu pake pip aja

1
pip install pyquery

setelah itu masuk ke console python nya lalu improttt aja pyquery nya.

1
from pyquery import PyQuery

setelah di import, kita coba akses satu halaman tembak kita.

1
html = PyQuery("http://www.adiputra.web.id")

Lalu, sekarang kita panggil text title page itu dengan perintah

1
html('title').text()

Jika bener, muncul deh text title nya.

Kalo mau ambil value bisa pakai html.val(), mau loop data bisa pake each(), pokoke kaya jquery banget deh.

Kalau mau post atau get datapun mudah. temen-temen bisa pake kode seperti dibawah ini.

1
PyQuery("http://www.namadomain.com", {'q': 'foo'}, method='post', verify=True)

q adalah key post nya, dan foo adalah value post nya. jangan lupa nambahin method nya ya.

Sampai disini, documentasi bisa dilihat di link diatas ya, happy scrapp 🙂

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.