Penggunaan Web Crawler Untuk Menghimpun Tweets dengan Metode Pre-Processing Text Mining

Main Article Content

Bayu Rima Aditya

Abstract

 Saat ini jumlah data di media sosial sudah terbilang sangat besar, namun jumlah data tersebut masih belum banyak dimanfaatkan atau diolah untuk menjadi sesuatu yang bernilai guna, salah satunya adalah tweets pada media sosial twitter. Paper ini menguraikan hasil penggunaan engine web crawel menggunakan metode pre-processing text mining. Penggunaan engine web crawel itu sendiri bertujuan untuk menghimpun tweets melalui API twitter sebagai data teks tidak terstruktur yang kemudian direpresentasikan kembali kedalam bentuk web. Sedangkan penggunaan metode pre-processing bertujuan untuk menyaring tweets melalui tiga tahap, yaitu cleansing, case folding, dan parsing. Aplikasi yang dirancang pada penelitian ini menggunakan metode pengembangan perangkat lunak yaitu model waterfall dan diimplementasikan dengan bahasa pemrograman PHP. Sedangkan untuk pengujiannya menggunakan black box testing untuk memeriksa apakah hasil perancangan sudah dapat berjalan sesuai dengan harapan atau belum. Hasil dari penelitian ini adalah berupa aplikasi yang dapat mengubah tweets yang telah dihimpun menjadi data yang siap diolah lebih lanjut sesuai dengan kebutuhan user berdasarkan kata kunci dan tanggal pencarian. Hal ini dilakukan karena dari beberapa penelitian terkait terlihat bahwa data pada media sosial khususnya twitter saat ini menjadi tujuan perusahaan atau instansi untuk memahami opini masyarakat

Downloads

Download data is not yet available.

Article Details

How to Cite
ADITYA, Bayu Rima. Penggunaan Web Crawler Untuk Menghimpun Tweets dengan Metode Pre-Processing Text Mining. JURNAL INFOTEL, [S.l.], v. 7, n. 2, p. 93-100, nov. 2015. ISSN 2460-0997. Available at: <http://ejournal.st3telkom.ac.id/index.php/infotel/article/view/35>. Date accessed: 25 may 2019. doi: https://doi.org/10.20895/infotel.v7i2.35.
Section
Articles

References

[1] A.S, Rosa and Shalahudin, M. 2011. Modul Pembelajaran Rekayasa Perangkat Lunak (Terstruktur dan Berorientasi Objek). Modula, Bandung.
[2] Castillo, C. 2004. EffectiveWeb Crawling. (p. i). Dept. of Science: University of Chile
[3] Feldman, R & Snager, J. 2007. The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. Cambridge University Press, New York
[4] Khanna, Rajiv A dan Kasliwal, Sourabh. 2007. Designing A Web Crawler.
[5] Nur, Muhamad Yunus., & Santika, Diaz. D. (2011). Analisis Sentimen pada Dokumen Berbahasa Indonesia dengan Pendekatan Support Vector Machine. Konferensi Nasional Sistem dan Informatika, (Vol. 009). Bali.
[6] Pitria, Pipit. 2014. Analisis Sentimen Pengguna Twitter Pada Akun Resmi Samsung Indonesia Dengan Menggunakan Naïve Bayes. Hyperlink: http://elib.unikom.ac.id/index.php/gdl.php?mod=browse&op=read&id=jbptunikompp-gdl-pipitpitri-35651 diakses 7 April 2015.
[7] Pressman, S. Roger. 2010. Software Engineering: A Practitioner's Approach.
[8] Rosmala, Dewi & Syafei, Rizqia Riyani. 2011. Implementasi Webcrawler pada Social Media Monitoring. Hyperlink: http://lib.itenas.ac.id/kti/wp-content/uploads/2013/10/No.-2-Vol.-2-Mei-Agustus-2011-5.pdf diakses 7 april 2015.
[9] Sigit, Yohanes & dkk. 2012. Analisis dan Perancangan Alat Bantu Monitor Brand Universitas Atma Jaya Yogyakarta di Situs Jejaring Sosial Twitter. Hyperlink: http://jurnal.uajy.ac.id/jbi/2012/01/11/analisis-dan-perancangan-alat-bantu-monitor-brand-universitas-atma-jaya-yogyakarta-di-situs-jejaring-sosial-twitter/ diakses 8 April 2015.
[10] Twitter. 2014. Tweets | Twitter Developers. Online. Hyperlink:https://dev.twitter.com/docs/platform-objects/tweets) diakses 6 April 2015.