Path: Top > Skripsi - D4 > 2017 > Jurusan Teknik Komputer & Informatika > Program Studi Teknik Informatika > 2018

Ekstraksi Informasi 5W dari Berita Nasional Berbahasa Inggris dengan Memodifikasi Sistem NewsX

Five Ws Information Extraction of English National News by Modifying NewsX System

Skripsi, 011 / 2018 / TI4
Undergraduate Theses from JBPTPPOLBAN / 2019-02-26 10:20:19
Oleh : Eva Danti Rahmanita - 141524004 (eva.danti.tif414@polban.ac.id)
Dibuat : 2019-02-26, dengan 4 file

Keyword : ekstraksi berita, pertanyaan 5W, berita nasional berbahasa Inggris
Subjek : news extraction, 5Ws question, english language national news

Kebutuhan masyarakat yang besar akan informasi terbaru mendorong pertumbuhan portal berita online dan artikel yang tersebar di dunia maya. Dengan banyaknya berita yang tersedia, pembaca dapat mengalami kesulitan untuk bisa langsung menemukan inti sari dari berita yang ada. Pendekatan yang digunakan agar bisa mempersingkat waktu untuk mendapatkan inti sari berita adalah dengan membuat sistem ekstraksi informasi 5W. Salah satu penelitian yang berkontribusi dalam hal ini adalah penelitian Wunderwald tahun 2008. Penelitian ini membuat sistem yang bisa mengekstraksi 5W dari berita nasional berbahasa Inggris. Pendekatan yang dilakukan yaitu dengan merekonstruksi sistem ekstraksi informasi 5W dari berita dengan memodifikasi penelitian Wunderwald dengan menambahkan data named entity bahasa Indonesia pada sistem, mengubah jumlah tree pada random forest classifier, dan mengubah jumlah fitur. Eksperimen dilakukan dengan membandingkan sistem yang telah dimodifikasi dengan sistem yang belum dimodifikasi. Akurasi yang dinilai adalah hasil eksperimen dari ekstraksi 5W oleh sistem dan performa model klasifikasi WHO dan WHERE terhadap data uji. Pada eksperimen yang telah dilakukan pada model klasifikasi WHO dan WHERE, eksperimen pada sistem yang telah dimodifikasi menunjukkan nilai performa lebih baik dibandingkan skenario sistem non modifikasi. Model klasifikasi WHO pada sistem tanpa modifikasi memperoleh f-measure sebesar 19,0476%, sedangkan pada eksperimen sistem yang dimodifikasi, perolehan nilai bisa mencapai 22,22%. Model klasifikasi WHERE mendapatkan f-measure sebesar 0% pada sistem non modifikasi, sedangkan sistem modifikasi memperoleh f-measure hingga 11,76%. Pada evaluasi hasil ekstraksi 5W, sistem non modifikasi maupun skenario sistem modifikasi mendapatkan nilai akurasi tertinggi yang sama pada ekstraksi WHO, WHAT, dan WHY. Sedangkan skenario sistem modifikasi mendapatkan nilai lebih tinggi dibandingkan sistem non modifikasi pada hasil ekstraksi WHERE, dengan akurasi sebesar 16,7%. Hasil evaluasi ekstraksi WHO dan WHAT pada sistem non modifikasi dan sistem modifikasi, keduanya menghasilkan nilai akurasi tertinggi yang sama sebesar 25%, sedangkan pada ekstraksi WHY, kedua sistem mendapatkan akurasi sebesar 41,7%. Sedangkan pada tahap ekstraksi WHEN, hasil akurasi pada setiap skenario, baik pada sistem yang dimodifikasi maupun tidak, sama-sama mendapatkan akurasi sebesar 66,67%. Kata Kunci: ekstraksi berita, pertanyaan 5W, berita nasional berbahasa Inggris.

Deskripsi Alternatif :

The great needs of the community for the latest information contributed to the growth of online news portals and articles spread in internet. The number of articles available makes it difficult for readers to understand the core of the news. An approach that can be used to shorten the time to understand the core of the news is to make a 5Ws information extraction system. One of the studies that contributed to this was the Wunderwald's study in 2008. This research tries to make the 5W information extraction system on English national news. The approach taken is by reconstructing the 5W information extraction system following the Wunderwald study with modifications by adding Indonesian named entity in the system, modifying the size of the tree, and modifying number of features. This research's experiment compares unmodified system with the modified system. The accuracy of 5Ws extraction system and the performance of WHO and WHERE classification model on the test data were assessed against experimental result. In WHO and WHERE classification's experiment, modified system gets higher performance score compared to the non modified system. WHO classifier's model in non modified system obtains f-measure of 19,0476%, while in modified system, the score can reach up to 22,22%. WHERE classifier's model gets 0% f-measure on non modified system, while the modified obtains f-measure up to 11,76%. In evaluating 5W extraction results, both the non-modification system and the modified system scenario, all gives the same highest accuracy score in WHO, WHAT, and WHY extraction. Whereas the modified system gets higher score than the non-modified system in WHERE extraction, with an accuracy of 16.7%. The results of WHO and WHAT extraction evaluation on the unmodified system and modified system, obtained the highest accuracy score of 25%, whereas in WHY extraction, both systems obtained accuracy score of 41.7%. Whereas in the WHEN extraction stage, the results of accuracy in each scenario, whether modified or not, both obtained an accuracy of 66.67%. Keywords: news extraction, 5Ws question, english language national news.

Beri Komentar ?#(0) | Bookmark

PropertiNilai Properti
ID PublisherJBPTPPOLBAN
Organisasi
Nama KontakHelmi Purwanti
AlamatJl. Trsn. Gegerkalong Hilir Ds. Ciwaruga
KotaBandung
DaerahJawa Barat
NegaraIndonesia
Telepon022 201 3789 ext. 168, 169, 239
Fax022 201 3889
E-mail Administratorhelmi.purwanti@polban.ac.id
E-mail CKOhelmi.purwanti@polban.ac.id

Print ...

Kontributor...

  • Pembimbing 1: Jonner Hutahaean, BSET., M.InfoSys.

    Pembimbing 2: Yudi Widhiyasana, S.Si., M.T., Editor: Erlin Arvelina

Download...