Path: Top > Tugas Akhir - D3 > Jurusan Teknik Komputer dan Informatika > Program Studi Teknik Informatika > REGULER > 2014

Mesin Pencari terhadap File Portable Document Format (PDF) dan Halaman Web

Search Engine of Portable Document Format (PDF) File and Web Page

Tugas Akhir, 002 / 2014 / JKI
Undergraduate Theses from JBPTPPOLBAN / 2018-04-09 15:36:08
Oleh : Adrianus Galang Permana Putra - 111511001, Mochamad Yoga Tritama - 111511020, & Rika Oktaviani - 111511028 (rika.jtk11@gmail.com)
Dibuat : 2018-04-09, dengan 4 file

Keyword : mesin pencari, TF/IDF, LSA, similarity
Subjek : search engines, TF / IDF, LSA, similarity

Keberadaan teknologi informasi dan komunikasi membuat kebutuhan akan informasi semakin besar, hal ini mengakibatkan bertambahnya jumlah informasi yang ada, sehingga sulit untuk mencari informasi yang dicari. Kondisi tersebut membuat para ahli untuk membangun system yang dapat mempercepat pencarian informasi yang kemudian dikenal dengan mesin pencari (search engine). Salah satu mesin pencari yang telah dikenal adalah Google, namun Google masih memiliki kelemahan yaitu menggunakan teknik search engine optimization (SEO) pada metode Pagerank, sehingga hasilnya tidak sesuai dengan yang diharapkan. Pada tugas akhir ini dibangun sebuah mesin pencari dengan metode pembobotan lain untuk mengabaikan SEO tersebut. Metode yang digunakan untuk membangun mesin pencari ini adalah term frequency / inverse document frequency (TF/IDF) digunakan untuk menghitung bobot pencarian dan latent semantic analysis (LSA) digunkan untuk mendapatkan nilai kemiripan antar dokumen. Teknik TF/IDF menggabungkan dua konsep untuk perhitungan bobot, yaitu frekuensi kemunculan suatu kata dalam sebuah dokumen tertentu dan inverse frekuensi dokumen yang mengandung kata tersebut. Frekuensi kemunculan kata dalam dokumen yang diberikan menunjukkan seberapa penting dan seberapa umum kata itu dalam dokumen tersebut. Bobot hubungan antara sebuah kata dan sebuah dokumen akan tinggi apabila frekuensi kata tersebut tinggi di dalam dokumen dan frekuensi dokumen yang mengandung kata tersebut rendah. Dari uji coba yang sudah dilakukan, diperoleh kesimpulan bahwa dengan menggunakkan teknik TF/IDF, dokumen yang dihasilkan oleh system lebih banyak mengandung informasi yang dicari dibandingkan menggunakan teknik yang digunakan oleh Google. Meskipun demikian, sistem yang telah dibangun masih memiliki kekurangan yaitu tidak dapat melakukan pencarian terhadap kata majemuk karena kedudukan kata pada setiap dokumen tidak diperhatikan. Kata kunci: mesin pencari, TF/IDF, LSA, similarity.

Deskripsi Alternatif :

The existence of information and communication technologies makes the need for information more intense, this phenomenon has resulted in the increasing amount of information available. So it is difficult to find the right information. These conditions make the experts to build a system that can speed up searching for information that became known as search engine. One of the well-known search engines are Google, but Google still has the lack of using the search engine optimization (SEO) techniques on its PageRank method, so their results are not as expected. In this final project built a search engine with another weighting method to ignore that SEO. The method used to build this search engine is term frequency / inverse document frequency (TF/IDF) used to calculate the weight of the search and latent semantic analysis (LSA) used to get the value of similarity between documents. TF/IDF technique combines two concepts for calculation of the weights,frequency of occurrence of a word in a particular document frequency and inverse document containing the word. Frequency of occurrence of the word in a given document shows how important and how common the word is in a document. Weight of relationship between a word and a document will be high if the frequency of a words in the document is high and the frequency of document that contains a word is low. From the experiments that have been conducted, it is concluded that by using the TF / IDF technique, a document resulted by the system contains more the right information than using a search technique used by Google. Nevertheless, the system has been built still has the lack that can not conduct a search of a compound word because the position of word in each document is not considered. Keywords: search engines, TF / IDF, LSA, similarity.

Beri Komentar ?#(0) | Bookmark

PropertiNilai Properti
ID PublisherJBPTPPOLBAN
Organisasi
Nama KontakErlin Arvelina
AlamatJl. Trsn. Gegerkalong Hilir Ds. Ciwaruga
KotaBandung
DaerahJawa Barat
NegaraIndonesia
Telepon022 201 3789 ext. 168, 169, 239
Fax022 201 3889
E-mail Administratorerlin.arvelina@polban.ac.id
E-mail CKOerlin.arvelina@polban.ac.id

Print ...

Kontributor...

  • Pembimbing 1: Urip Teguh Setijohatmo, B.S.C.S., M.Kom.

    Pembimbing 2: Ani Rahmani, S.Si., M.T., Editor: Erlin Arvelina

Download...