Social Web Data Mining (2) – Mari belajar Python

I. Intro

Setelah posting edisi yang lalu, tentang bagaimana saya tertarik dalam bermain “teks” di dunia web, pada posting kali ini, saya ingin sedikit bercerita tentang bagaimana saya memulai “hobi” ini. Tujuan dari posting ini adalah, memberikan sedikit arahan dan rujukan berdasarkan jejak-jejak virtual saya :D

Langsung saja ya! Pertama kali saya mempelajari “social web data mining”, mata saya tertuju pada satu nama pemrograman yang cukup “legendaris” di kalangan pengguna sistem operasi Linux: bahasa pemrograman Python. Nama Python tidak ada kaitannya sama sekali dengan nama binatang. Justru menariknya, nama ini diambil dari sebuah acara di BBC, yang menginspirasi pembuat Python: Guido Van Rossum.

Kesan pertama saya ketika berkenalan dengan Python adalah, bahasa ini tidak memiliki prosedur serumit bahasa lain, seperti C/C++ , PHP. Namun demikian, ada beberapa perbedaan mendasar yang perlu diperhatikan, seperti karakter “spasi” yang berperan penting di Python untuk menandai indentasi script untuk fungsi (yang di bahasa C/C++ ditandai dengan karakter “{” dan “}” ). Selain itu, bahasa ini cukup “intuitif” dan mudah dimengerti dalam waktu yang relatif cukup singkat.

II. Mari belajar Python

Dalam mempelajari Python, beberapa hal yang saya lakukan pertama kali adalah :

1. Melakukan instalasi dan upgrade Python. Untuk informasi detail dan lengkap, ada baiknya Sampeyan berkunjung ke situs resmi Python: http://www.python.org/

Versi yang saat ini saya pakai adalah versi 2.7.3, yang juga banyak digunakan dalam berbagai buku data mining berbasis Python. Tidak ada salahnya untuk melakukan pengecekan, apakah di dalam komputer Sampeyan (terutama bagi mereka yang menggunakan Mac), sudah terpasang Python atau belum. Cara paling mudah, tentu dengan mengeksekusi perintah berikut ini pada aplikasi “terminal” atau “console” (jika Sampeyan menggunakan linux):

$ python --version

Yang jika dieksekusi dengan benar akan menghasilkan (versi dalam komputer saya berbeda dengan komputer Sampeyan):

Python 2.7.3

Jika Sampeyan menggunakan Python 2.7.3 dengan instalasi Enthought (paket scientific python), maka notifikasi yang akan Sampeyan peroleh pada layar konsole sebagai berikut:

Python 2.7.3 -- EPD_free 7.3-2 (32-bit)


2. Mencoba mencari file-file tutorial yang pas, cepat dimengerti, dan langsung menuju sasaran.

Langkah kedua ini bukan perkara yang gampang. Ada ribuan tutorial di internet. Masalahnya, mana yang paling cepat dan paling pas untuk kita, sehingga kita bisa mengerti Python dengan baik, sekaligus menguasai bahasa pemrograman ini dalam waktu yang relatif singkat. Berikut ini beberapa link yang mungkin bisa dirujuk:

3. Mencoba menerapkan apa yang ada pada tutorial, langsung di komputer.

Bagi saya, belajar bahasa pemrograman sama dengan membuat program itu sendiri. Dan tidak ada alasan lain untuk “paham”, selain mencoba sendiri apa yang tertulis dalam tutorial tersebut. Bagi yang “malas” menulis (meskipun saya tidak merekomendasikan), bisa saja melakukan “copy and paste” dari script-script contoh dan langsung mengeksekusi programnya untuk melihat hasilnya. Namun tentu, menulis sendiri satu huruf demi satu huruf akan membuat ingatan dan pemahaman kita tertanam lebih lama.

Sampai di sini dulu artikel kali ini. Pada artikel mendatang, kita akan mencoba menilik lebih jauh, apa saja logistik dan kebutuhan-kebutuhan yang harus kita dapatkan untuk mengolah data dari web. Beberapa perangkat lunak harus kita siapkan. Sebagian besar dari perangkat lunak yang kita gunakan tersedia secara gratis, namun memang butuh sedikit “ikhtiar” untuk melakukan instalasi ke komputer kita :)

{Bersambung}

 

Be Sociable, Share!
Categories: Machine Learning

Leave a Reply