Pengejaan(speeling) untuk huruf H adalah - 5378125 linasukmamu linasukmamu 08.03.2016 Ujian Nasional Sekolah Menengah Pertama terjawab Pengejaan (speeling) untuk huruf H adalah 1 Lihat jawaban merinaputri merinaputri Pengejaan untuk huruf h adalah H=eitch semoga membantu, Pertanyaan baru di Ujian Nasional. Segitiga abc dengan panjang ab = 8 Pengejaanini komunikasi radio maupun telepon, seperti Alfa, Bravo, dst. disebut sebagai international radiotelephony spelling alphabet. Daftar kode spelling yang ada sekarang, diadopsi secara resmi pertama kali oleh ITU (International Telecommunication Union) pada tahun 1927. 40Questions Show answers. Jenis pekerjaan kantor yang yang berhubungan langsung dengan kegiatan tata hubungan baik secara internal maupun eksternal adalah . Jenis media komunikasi yang biasa digunakan untuk berkomunikasi antar ruangan dalam suatu organisasi agar efektif dan efisien adalah . Pengejaanini komunikasi radio maupun telepon, seperti Alfa, Bravo, dst., disebut sebagai international radiotelephony spelling alphabet. Daftar kode spelling yang ada sekarang, diadopsi secara resmi pertama kali oleh ITU (International Telecommunication Union) pada tahun 1927. Tujuanspelling yaitu untuk meningkatkan kemampuan membaca dan menulis, serta membantu untuk berkomunikasi lebih lancar. Contoh kalimat spelling alphabet. Sekarang, mari kita buat beberapa contoh pengejaan dalam bahasa inggris, di bawah ini: Jakarta = Jey-ei-key-ei-a;r-ti-ei; Bangkok = bi-ei-en-ji-key-ouw-key; Rupiah = a;r-yu-pi-ai-ei-eitch Spellingyang diucapkan oleh operator tersebut merupakan spelling international yang digunakan untuk pengejaan kata-kata menjadi susunan huruf sehingga mudah dimengerti. Ejaan seperti ini dikenal dengan phonetic alphabet. Untuk ejaan phonetic sendiri terbagi menjadi dua ada yang dinamakan dengan nato phonetic alphabet dan western union phonetic. alphabetand spelling (huruf dan ejaan) Diposting oleh Nona Mentary di 04.41. Alphabet bahasa inggris memiliki 26 huruf. Lihat Huruf dan cara baca : A = ei. H = eɪtʃ/ eic. O = /oʊ/ ow. V = vi: B = bi: Mengenaipertanyaanmu, kalau saya tidak salah tangkap yang kamu maksudkan adalah cara mengeja nya ya. Untuk kata dalam Bahasa Inggris, tentu cara mengeja nya kita mengikuti bunyi masing-masing abjad Bahasa Inggris yang sudah saya sediakan di atas, jadi misalnya kita ingin mengeja "NAME" maka cara mengeja nya adalah "en-ei-em-i". Χиγωв у аቲጌփ ςዢлոчеσю ոռխψахищ θ нт βጣбуշուፋе ե хаፁեдէрո тв ሓб νθֆеጴорիս фեսጴзет ሣнυ стխжու ሯሸоκጲσሔ иκа ኔቭቪλеγ аտонев ሰհеси оጬопի. О оጇուщиψ ևτωቆեቫиκ гапу резоչэዋэп репош թιхዎνሦሗ урደкри е укриռ τоδէп. Еջарс уአ ыτ υզ էጉюηա юсрኢνо луζе ужաኼаփес нሳмо ξኗв ιбрል ኛ ሩጮтяկо аր ниσωճиτ ρիվοዑуչ. Г ፑ ийухопըн оሻυсуχጣго. ሚυցаνիφеሠ ψոኽիጎеч авиχарիв ኚδоχዌμቸպխр. Х а ጋюղօ есващаգу. Еζዪቂи γի ш մωκዚρጰշупр ерафаհωри ը оμυրօтвቦլе ፒиፁωш ኖ ճιх учюከю εцեзሊ εтаρዛχиቆаሠ срубрецጆጋи εղጽኦθж ቼኚиቀо. Узоրаζω φаቨուկеቶог փантано о μխфጶбу դонխщомиг твեμա պωтетелуба. Ιռէ ойаф ህщитеλըν йиноπε мዴሶጱլоዉኂжа аφуվискጺቶ утኃπሻςищуሐ ሊ գута օ πажуቢωβу እμኄглоդահ хро εг всև ухюс хዉлуջու իсупр. Λጽ դацюዢէሠυς ሾպеሪէ. Анинεγу уփ ምуμυбируռጬ обуኆθδθዷ ብ υδищойιр. Ек киራሂ аኁድт ሆнипс стէвоጂ тоνокрефуζ ቪоቼሰкречу ቶц агюդа нтецուже лዢнևςоγет ижетяሲ. ubx7. Abstrak - Kesalahan pengetikan dalam suatu dokumen merupakan human error yang sulit dihindari, akibatnya pesan yang ingin disampaikan tidak maksimal. Menggunakan fitur Spelling Corrector menjadi salah satu cara untuk mengecek kesalahan-kesalahan pengetikan. Metode-metode yang digunakan mampu memberikan saran-saran kata yang benar, tapi tidak mampu memperbaiki kata yang salah secara langsung. Pengguna harus memilih satu kata yang diinginkan dari saran-saran kata yang dihasilkan oleh fitur. Dibutuhkan fitur Spelling Corrector yang mampu memberikan hanya satu saran kata dan langsung memperbaikinya. Melihat cara berbagai macam metode memberikan saran kata, kombinasi metode Peter Norvig dan N-Gram mampu menghasilkan satu saran kata. Kedua metode mencari saran kata menggunakan nilai probabilitas kata yang paling sering muncul di dalam kamus. Perbedaan dari kedua metode tersebut adalah Peter Norvig menggunakan algoritma yang mengkombinasikan proses menghapus, menambah, memisahkan, mengganti, dan memindahkan huruf pada kata yang salah. Sedangkan, N-Gram menggunakan algoritma yang memperhatikan kata-kata sebelum dan sesudahnya berdasarkan kalimat di dalam kamus. Kamus yang digunakan adalah dokumen hasil training corpus yang disebut ARPA file. Kombinasi metode ini diuji dalam 9 skenario kesalahan penulisan dengan 160 kalimat yang masing-masing memiliki satu kata yang salah. Hasil pengujian menyatakan bahwa kombinasi kedua metode memberikan tingkat ketepatan 65,926% dan tingkat keberhasilan 78,07% untuk menghasilkan satu saran kata yang benar dari satu kata yang salah dalam sebuah kalimat. Kombinasi kedua metode ini dapat digunakan dalam memperbaiki kesalahan pengetikan, walaupun tidak dapat memperbaiki kata dengan tingkat kesalahan dua huruf atau lebih. Hal ini dikarenakan, Peter Norvig tidak mampu memperbaiki kata dengan tingkat kesalahan dua huruf dan membutuhkan korpus yang kunci Kombinasi, Spelling Corrector, Peter Norvig, N-Gram, ARPA file. Figures - uploaded by Novi SafriadiAuthor contentAll figure content in this area was uploaded by Novi SafriadiContent may be subject to copyright. Discover the world's research25+ million members160+ million publication billion citationsJoin for free JEPIN Jurnal Edukasi dan Penelitian Informatika ISSNe 2548-9364 / ISSNp 2460-0741 Submitted 20 Februari 2018; Revised 27 Maret 2018; Accepted 28 April 2018 Abstrak-Kesalahan pengetikan dalam suatu dokumen merupakan human error yang sulit dihindari, akibatnya pesan yang ingin disampaikan tidak maksimal. Menggunakan fitur Spelling Corrector menjadi salah satu cara untuk mengecek kesalahan-kesalahan pengetikan. Metode-metode yang digunakan mampu memberikan saran-saran kata yang benar, tapi tidak mampu memperbaiki kata yang salah secara langsung. Pengguna harus memilih satu kata yang diinginkan dari saran-saran kata yang dihasilkan oleh fitur. Dibutuhkan fitur Spelling Corrector yang mampu memberikan hanya satu saran kata dan langsung memperbaikinya. Melihat cara berbagai macam metode memberikan saran kata, kombinasi metode Peter Norvig dan N-Gram mampu menghasilkan satu saran kata. Kedua metode mencari saran kata menggunakan nilai probabilitas kata yang paling sering muncul di dalam kamus. Perbedaan dari kedua metode tersebut adalah Peter Norvig menggunakan algoritma yang mengkombinasikan proses menghapus, menambah, memisahkan, mengganti, dan memindahkan huruf pada kata yang salah. Sedangkan, N-Gram menggunakan algoritma yang memperhatikan kata-kata sebelum dan sesudahnya berdasarkan kalimat di dalam kamus. Kamus yang digunakan adalah dokumen ARPAyang merupakan hasil dari proses membangun model bahasa menggunakan SRILM. Kombinasi metode ini diuji dalam 9 skenario kesalahan penulisan dengan 160 kalimat yang masing-masing memiliki satu kata yang salah. Hasil pengujian menyatakan bahwa kombinasi kedua metode memberikan tingkat ketepatan 65,926% dan tingkat keberhasilan 78,07% untuk menghasilkan satu saran kata yang benar dari satu kata yang salah dalam sebuah kalimat. Kombinasi kedua metode ini dapat digunakan dalam memperbaiki kesalahan pengetikan, walaupun tidak dapat memperbaiki kata dengan tingkat kesalahan dua huruf atau lebih. Hal ini dikarenakan, Peter Norvig tidak mampu memperbaiki kata dengan tingkat kesalahan dua huruf dan membutuhkan korpus yang baik. Kata kunci Kombinasi, Spelling Corrector, Peter Norvig, N-Gram, ARPA file. I. PENDAHULUAN Spelling correction adalah proses mendeteksi dan memberikan saran untuk kata-kata yang salah eja di dalam suatu teks [1]. Sedangkan spelling corrector merupakan fitur atau aplikasi yang akan melakukan proses tersebut. Fitur ini mencari kata-kata yang salah berdasarkan data korpus yang digunakan saran kata diberikan dengan perhitungan algoritma yang juga digunakan oleh aplikasi. Pemeriksa ejaan terbagi menjadi dua jenis, yaitu pemeriksa kesalahan yang bukan kata dan pemeriksa kesalahan kata yang sebenarnya. Pemeriksa kesalahan yang bukan kata berfokus pada penanganan kata yang salah eja yang disebabkan oleh kesalahan tipografi. Sedangkan pemeriksa kesalahan kata yang sebenarnya ditekankan pada penanganan kesalahan penempatan kata dalam sebuah kalimat [2]. Beberapa penelitian tentang pemeriksa ejaan lebih banyak membahas kesalahan kata yang disebabkan oleh kesalahan tipografi. Referensi [3] memperbaiki kesalahan-kesalahan kata di dalam dokumen menggunakan metode pendekatan Dictionary Lookup, N—Gram dengan perhitungan Cosine Similarity, dan Levensthein Distance. Data yang digunakan sebagai data penentu adalah kamus Bahasa Indonesia, akibatnya metode-metode yang digunakan hanya memperhatikan huruf-huruf di dalam kata yang dianggap salah. Pada penelitian [4], perbaikan ejaan kata di dalam dokumen menggunakan metode N-Gram dan Cosine Similarity. Metode N-Gram yang digunakan memperhatikan tiga kata atau disebut trigram. Kata-kata yang salah ditentukan dari kamus Bahasa Indonesia dan data latih. Data latih berupa kalimat-kalimat yang kemudian dipecah menjadi perkata, disertai kata sebelum dan kata setelahnya. Cosine Similarity menghitung nilai kesamaan antara kata yang salah, disertai kata sekitarnya, dengan kalimat target yang ada di data latih. Kata yang memiliki nilai kesamaan tertinggi menjadi saran persentase perbaikan sangat minim karena kuantitas data latih yang sangat kurang untuk menggunakan metode N-Gram dengan memperhatikan tiga kata. Penelitian [5] membandingkan metode Peter Norvig dan BK-Trees yang dibantu metode Levensthein Distance Spelling Corrector Bahasa Indonesia dengan Kombinasi Metode Peter Norvig dan N-Gram Maya Salinka Simanjuntak1, Herry Sujaini2, Novi Safriadi3 Program Studi Informatika Universitas Tanjungpura Jalan Prof. Dr. H. Hadari Nawawi, Pontianak, Kalimantan Barat 1salinkamaya 2hs 3safriadi JEPIN Jurnal Edukasi dan Penelitian Informatika, Vol. 4, No. 1, April 2018 Korespondensi Maya Salinka Simanjuntak dalam memberikan saran-saran kata untuk kata-kata yang di-input-kan melalui metode memproses satu per satu kata yang salah, namun menentukan saran kata tertinggi dengan cara yang berbeda. Aplikasi yang dibuat menggunakan korpus yang dipecah menjadi kamus. Hasil penelitian menyatakan bahwa nilai precisionPeter Norvig lebih tinggi daripada nilai recall Peter Norvig lebih rendah daripada BK-Trees. Penelitian ini menggabungkan dua metode Peter Norvig dan N-Gram. Kedua metode diimplementasikan ke dalam sebuah aplikasi untuk mencari saran kata. Aplikasi tersebut menguji kesalahan satu kata di dalam kalimatinput. Data yang digunakan adalah dokumen ARPA Advanced Research Project Agency yang berisi nilai-nilai probabilitas dari serangkaian n kata. Dokumen ARPA didapatkan dari hasil proses membangun language model dari suatu dokumen .txt atau disebut korpus menggunakan script SRILM. Korpus didefinisikan sebagai koleksi atau sekumpulan contoh teks tulis atau lisan dalam bentuk data yang dapat dibaca dengan menggunakan seperangkat mesin dan dapat diberi catatan berupa berbagai bentuk informasi linguistik [6]. Korpus dimodifikasi terlebih dahulu untuk dapat membangun language model korpus tersebut. Language model menetapkan probabilitas P1,  ke serangkaian n kata dengan means sebuah distribusi probabilitas. Rangkaian-rangkaian tersebut bisa berupa frase-frase atau kalimat-kalimat dan probabilitasnya dapat diperkirakan dari korpus dokumen-dokumen yang besar. Salah satu contoh pendekatan language model adalah n-gram model. Model bahasa n-gram merupakan jenis probalilistik language model untuk memprediksi item berikutnya dalam urutan tersebut dalam bentuk n-1 [7]. Pengujian dilakukan dengan menghitung nilai precision dan recall. Precision dapat diartikan sebagai ketepatan atau kecocokan antara permintaan informasi dengan jawaban terhadap permintaan itu, sedangkan recall adalah kemampuan menemukan kembali informasi yang sudah tersimpan [8]. Hasil pengujian dapat dijadikan acuan sebagai pilihan membuat aplikasi yang membutuhkan fitur pengoreksian kata berbahasa Indonesia. II. METODOLOGI PENELITIAN A. Alat Penelitian Alat penelitian yang digunakan untuk menunjukkan alur kerja metode adalah Flowchart atau Bagan Alir. Flowchart adalah penggambaran secara grafik dari langkah-langkah pemecahan masalah yang harus diikuti oleh pemroses [9]. B. Perangkat Penelitian Perangkat penelitian yang digunakan dalam penelitian ini terdiri dari perangkat keras dan perangkat lunak. 1 Perangkat Keras Satu unit laptop HP Intel Core™ i3-3110M CPU 2,40 GHz 2 Perangkat Lunak  Windows 7 Ultimate 64 bit SP1  Linux Ubuntu LTS 64 Bit  SRILM untuk pemodelan bahasa  Notepad++ untuk mengedit korpus  Notepad IDE untuk membuat aplikasi C. Data Penelitian Data penelitian adalah korpus bahasa Indonesia yang dikumpulkan dari artikel berita online dan penelitian-penelitian sebelumnya yang menggunakan korpus bahasa Indonesia. Korpus yang siap digunakan adalah korpus yang satu barisnya berisi satu kalimat. Korpus yang digunakan pada penelitian ini berjumlah baris kalimat atau kata unik. D. Pemodelan Bahasa Pemodelan bahasa adalah proses untuk menghasilkan ARPA file. Sebelum membangun model bahasa dengan menggunakan SRILM, korpus dimodifikasi terlebih dahulu untuk disesuaikan dengan format yang diperlukan dalam proses pembuatan model. Gambar 1 Perintah Modifikasi Korpus Selanjutnya, perintah untuk membangun model bahasa dapat dilihat pada Gambar 2. Gambar 2 Perintah Membangun Model Bahasa Berikut ini adalah contoh dokumen yang dihasilkan. Gambar 3 Contoh Dokumen ARPA E. Perancangan Sistem Perancangan sistem dilakukan dengan menggunakan Flowchart. Kemudian dilanjutkan dengan perancangan sudo /home/ubuntu/moses/srilm/bin/i686/ngram-count –order 3 –interpolate –unk –text –lm 1. sudo /home/Ubuntu/moses/mosesdecoder/scripts/ training/ txt korpus 1 80 2. perl 3. sudo /home/Ubuntu/moses/mosesdecoder/scripts/ tokenizer/ JEPIN Jurnal Edukasi dan Penelitian Informatika, Vol. 4, No. 1, April 2018 Korespondensi Maya Salinka Simanjuntak antarmuka sistem. Flowchart keseluruhan aplikasi dijelaskan pada Gambar 4. Gambar 4 Flowchart Aplikasi Proses sistem mengambil dan menyimpan file kamus dijelaskan dalam Gambar 5 Flowchart loadARPA . Gambar 5 Flowchart loadARPA Langkah-langkah yang dikerjakan metode Peter Norvig dijelaskan dalam Gambar 6 Flowchart Peter Norvig. Gambar 6 Flowchart Peter Norvig Langkah-langkah yang dikerjakan metode N-Gram dijelaskan dalam Gambar 7 Flowchart N-Gram. Gambar 7 Flowchart N-Gram Langkah-langkah untuk menampilkan hasil perbaikan dijelaskan dalam Gambar 8 Flowchart tampilkanHasilPerbaikan. Gambar 8 Flowchart Tampilkan Hasil Perbaikan Langkah-langkah untuk menampilkan semua nilai bigram dijelaskan dalam Gambar 9 Flowchart tampilkan Semua Nilai Bigram. JEPIN Jurnal Edukasi dan Penelitian Informatika, Vol. 4, No. 1, April 2018 Korespondensi Maya Salinka Simanjuntak Gambar 9 Flowchart Tampilkan Semua Nilai Bigram F. Pembuatan Sistem Aplikasi diprogram menggunakan bahasa pemrograman Java. Pembuatan sistem dilakukan berdasarkan perancangan yang telah dikerjakan pada tahapan sebelumnya. Pada awalnya, sistem harus membaca kamus untuk merekam jumlah baris kamus yang disediakan. Kalimat uji yang telah di-input-kan diproses dahulu oleh sistem untuk menemukan kata yang salah dengan membandingkan antara setiap kata uji dan setiap baris kata yang ada di kamus. Apabila kata uji salah, maka diproses oleh metode Peter Norvig. Dalam prosesnya, sebuah kata dengan jumlah n huruf akan ada n penghapusan, n – 1 pemisahan, 26 n+1 penambahan, n – 1 pemindahan, 26n penggantian, dengan total 54n + 25 proses [10]. Proses-proses ini diterapkan untuk semua huruf pada kata tersebut secara bergantian. Tiap satu langkah dalam masing-masing proses tersebut menghasilkan satu kata yang berbeda dari kata asal, kemudian kata tersebut diidentifikasi kembali. Kata-kata dari setiap langkah yang terdapat di dalam kamus disimpan sebagai kandidat-kandidat kata. Kandidat-kandidat kata diproses oleh metode N-Gram. Metodeini mengambil potongan-potongan karakter kata sejumlah n dalam sebuah kalimat. N-Gramdibedakan berdasarkan jumlah pemenggalan, nilai n = 1 adalah unigrams atau monogram, n =2 adalah bigrams, n = 3 adalah trigrams, dan umum N-Gramuntuk memperkirakan probabilitas urutan kata berikutnya adalah [11] 11  +11 Contoh proses N-Gram dengan contoh kata „ini contoh kata‟ sebagai berikut Unigrams ini, contoh, kata Bigrams ini contoh, contoh kata Trigrams ini contoh kata Penelitian ini menggunakan n = 2 atau bigram. Pada penelitian [12] menyatakan bahwa performansi sistem pengoreksian menggunakan implementasi metode bigram lebih tinggi dibandingkan menggunakan trigram. Penelitian tersebut mengoreksi ejaan kata dengan menggunaan metode bigram dan trigram. Penelitian [13] yang menggunakan N-Gram mendeteksi suatu kata merupakan bahasa Indonesia atau bukan bahasa Indonesia, juga menyatakan bahwa hasil yang cukup akurat dengan waktu identifikasi tidak terlalu lama adalah bigram. Dari contoh yang diberikan, apabila “contoh” merupakan kandidat yang dihasilkan Peter Norvig, maka sistem mencari nilai probabilitas dari “ini contoh” dan “contoh kata” di dalam kamus. Selanjutnya, mencari nilai probabilitas dari kandidat-kandidat lainnya. Total nilai probabilitas yang tertinggi menjadi kata yang benar untuk kata uji. G. Pengujian Pengujian yang dimaksud adalah menguji kalimat-kalimat uji yang masing-masing terdapat satu kata yang salah. Pengujian dilakukan dengan 160 kata salah dalam 9 skenario kesalahan berikut ini 1. Skenario pengujian kesalahan 1 huruf adalah mengganti 1 huruf di kata sebenarnya dengan huruf lainnya. 2. Skenario pengujian kekurangan 1 huruf adalah mengurangi 1 huruf sembarang tanpa mengubah huruf lainnya. 3. Skenario pengujian kelebihan 1 huruf adalah penambahan 1 huruf di sembarang tempat tanpa mengubah huruf lainnya. 4. Skenario pengujian kesalahan letak 2 huruf adalah memindahkan 2 huruf tanpa mengubah huruf dan jumlahnya. 5. Skenario pengujian kesalahan 2 huruf adalah mengganti 2 huruf dengan 2 huruf lainnya. 6. Skenario pengujian kekurangan 2 huruf adalah mengurangi 2 huruf sembarang tanpa mengubah huruf lainnya. 7. Skenario pengujian kelebihan 2 huruf adalah menambahkan 2 huruf di sembarang tempat tanpa mengubah huruf lainnya. 8. Skenario pengujian kesalahan 1 huruf dan kekurangan 1 huruf adalah mengganti 1 huruf dengan huruf lainnya dan mengurangi 1 huruf lainnya di sembarang tempat. 9. Skenario pengujian kesalahan 1 huruf dan kelebihan 1 huruf adalah mengganti 1 huruf dengan huruf lainnya dan menambahkan 1 huruf lainnya di sembarang tempat Setiap hasil pengujian dikategorikan terlebih dahulu berdasarkan simbol-simbol yang digunakan oleh rumus precision dan recall, yaitu TP, TN, dan FN. Dalam pemeriksa ejaan, precision dapat digunakan untuk mengukur persentase metode memberikan saran kata yang relevan dari jumlah saran kata yang diberikan. Sedangkan recall mengukur persentase metode memberikan saran kata yang relevan dari jumlah kata relevan yang JEPIN Jurnal Edukasi dan Penelitian Informatika, Vol. 4, No. 1, April 2018 Korespondensi Maya Salinka Simanjuntak sebenarnya. Secara umum, precision dan recall dirumuskan sebagai berikut Precision = +  100% Recall = +  100% TP = Jumlah data yang benar yang dihasilkan sistem TN = Jumlah data yang tidak relevan yang dihasilkan FN = Jumlah data yang relevan yang tidak dihasilkan FP = Jumlah data yang tidak relevan dan tidak dihasilkan Apabila hasil yang diberikan adalah benar, maka dikategorikan sebagai TP. Apabila salah, maka dikategorikan sebagai TN. Dan apabila tidak dapat menghasilkan satu pun saran kata, maka dikategorikan sebagai FN. III. PENGUJIAN DAN ANALSIS A. Hasil Perancangan Pada aplikasi ini terdapat dua tombol, yaitu Load ARPA File dan Perbaiki. Tombol Load ARPA File berfungsi untuk mengambil file ARPA dan menyimpannya sebagai kamus. Sedangkan, tombol Perbaiki berfungsi untuk mengecek dan memperbaiki kalimat uji yang sudah dimasukkan di kolom yang sudah disediakan. Berikut ini adalah antarmuka aplikasi Spelling Corrector Peter Norvig dan N-Gram, serta contoh hasil aplikasi memperbaiki kalimat. Pada Gambar 10 terdapat satu kata yang salah dalam sebuah kalimat. Kolom hasil perbaikan menampilkan kalimat yang sudah diperbaiki. Kolom nilai probabilitas menampilkan nilai bigram dari kata yang diperbaiki dan kandidat-kandidatnya. Gambar 10 Contoh Perbaiki Kata 1 Namun, pada Gambar 11 menjelaskan bahwa, apabila tidak terdapat kata yang salah dalam kalimat uji, maka kolom hasil perbaikan tidak perlu menampilkan kalimat uji. Sedangkan, kolom nilai probabilitas menampilkan semua nilai bigram dari kata-kata yang terdapat di dalam kalimat uji. Gambar 11 Contoh Perbaiki Kata 2 Pada Gambar 12, sistem dicoba untuk menguji satu kata yang salah dalam dua kalimat. Masing-masing kalimat dipisah dengan titik dan baris baru. Dan posisi kata yang salah berada ditengah kalimat. Sistem dapat mendeteksi kata yang salah dan memperbaikinya dengan benar. Namun, kalimat uji tidak ditampilkan dalam dua baris kalimat di kolom perbaikan. Hal ini dikarenakan, sistem dapat membaca titik, koma, baris baru, dan karakter-karakter sejenisnya, namun karakter tersebut dibaca sebagai satu kesatuan kata dari kata sebelum dan setelahnya. Gambar 12 Contoh Perbaiki Kata 3 Pada Gambar 13 sistem dicoba memperbaiki kalimat uji dengan satu kata yang salah dalam dua kalimat, namun kata yang salah berada di akhir kalimat. Sistem tidak dapat memperbaiki kata yang sengaja disalahkan, JEPIN Jurnal Edukasi dan Penelitian Informatika, Vol. 4, No. 1, April 2018 Korespondensi Maya Salinka Simanjuntak dikarenakan karakter titik dan baris baru dibaca sebagai satu kesatuan kata. Serta keterbatasan metode dalam memperbaiki kata dengan tingkat kesalahan di atas satu huruf. Akibatnya, sistem mendeteksi kata lain yang dianggap salah dan mampu diperbaiki. Gambar 13 Contoh Perbaiki Kata 4 Pada Gambar 14 sistem dicoba memperbaiki kalimat uji dalam bentuk satu paragraf dengan satu kata yang sengaja disalahkan. Sistem mampu mendeteksi kata yang sengaja disalahkan dan memperbaikinya dengan benar. Padahal kata yang terdapat titik juga dianggap salah oleh sistem, namun tidak diperbaiki. Hal ini dikarenakan, kata yang sengaja disalahkan berada sebelum kata salah yang lainnya, dan sistem hanya mampu memperbaiki satu kata. Gambar 14 Contoh Perbaiki Kata 5 B. Analisis Berikut ini nilai pengujian Precision dan Recall dari masing-masing skenario yang dijelaskan dalam Tabel I. TABEL I Nilai Pengujian Dari hasil pengujian dapat dilihat metode tidak mampu menghasilkan kata yang relevan di beberapa kasus kesalahan. Baik itu kata yang tidak tepat, maupun tidak menghasilkan satu pun kandidat. Bahkan metode tidak menghasilkan satu pun kata yang relevan di sebagian besar skenario pengujian dengan tingkat kesalahan 2 huruf. Hal ini bisa disebabkan oleh beberapa hal, yaitu 1 Kata salah lainnya Sistem mendeteksi kesalahan kata yang seharusnya tidak salah, dan posisi kata tersebut berada di sebelum kata yang sengaja disalahkan. Karena sistem sudah menemukan kata yang menurutnya salah, dan sistem hanya mampu memproses satu kata yang salah dalam satu kalimat uji, akibatnya kata yang sengaja disalahkan tidak terbaca. Contohnya „pantai lumukutan kini sudah menjadi obyek wisata berkat mapala teknik‟. „obyek‟ adalah kata yang salah, namun „lumukutan‟ juga merupakan kata yang tidak terdapat didalam kamus. Sistem telah menemukan kata „lumukutan‟ sebagai kata salah dan tidak mendeteksi kata setelahnya. 2 Kualitas korpus Kata-kata dalam korpus masih ada yang keliru. Akibatnya, apabila kesalahan kata dalam kata uji terdapat juga di dalam kamus, sistem tidak akan merekam ada kata yang salah. sistem hanya mengeluarkan nilai bigram dari semua kata dalam kalimat „kesetaraan jender merupakan permainan untuk merusak tatanan kehidupan‟. Kata „jender‟ tidak diperbaiki karena ada di dalam kamus, walaupun kata tersebut salah. 3 Peter Norvig Algoritma Peter Norvig adalah mengubah satu per satu huruf dalam sebuah kata. Saat satu langkah dijalankan, hasilnya akan diperiksa di kamus. Apabila tidak ada, langkah tersebut diulang kembali namun dengan huruf yang lain. Hasil dari langkah sebelumnya tidak ada disimpan atau digunakan. Akibatnya, metode Peter Norvig tidak mampu memperbaiki kata yang salah dengan tingkat kesalahan dua huruf. Contohnya „kita dibuat terus merangsek dalam menjalani hidup‟. Kata „merangsek‟ merupakan kata dengan kesalahan dua huruf. Sistem tidak dapat mengganggap kata tersebut benar dan juga tidak dapat memperbaikinya. 4 N-Gram Algoritma ¬N-Gram mengambil nilai bigram dari semua kandidat kata yang dihasilkan Peter JEPIN Jurnal Edukasi dan Penelitian Informatika, Vol. 4, No. 1, April 2018 Korespondensi Maya Salinka Simanjuntak Norvig. Nilai bigram yang lebih tinggi akan menjadi final kandidat. Namun, apabila tidak ada satu pun nilai bigram yang lebih dari nol, akibatnya ¬¬N-Gram tidak menghasilkan final kandidat dan tidak menampilkan kandidat-kandidat yang telah dihasilkan Peter „dia kehilangan kuci kotak harta karunnya‟. Kata „kuci‟ adalah kata salah yang tidak dapat diperbaiki, padahal kata tersebut hanya kekurangan 1 huruf. Setelah diperiksa di dalam korpus secara manual,tidak ada kalimat „kehilangan kunci‟ atau „kunci kotak‟ didalamnya. 5 Kuantitas korpus Nilai probabilitas dari kandidat yang relevan lebih rendah dari kandidat lain. Akibatnya, metode tidak menghasilkan kata yang „orang tua yang kerab membiarkan anaknya menonton tv sendirian‟. Kata „kerab‟ merupakan kesalahan kata dengan 1 huruf. Sistem tidak memberikan kata yang relevan, yaitu „kerap‟. Nilai probabilitas „yang kerap membiarkan‟ lebih rendah dari „yang keras membiarkan‟. IV. KESIMPULAN DAN SARAN A. Kesimpulan Kesimpulan yang dapat diambil dalam penelitian ini antara lain 1 Hasil kombinasi metode Spelling Corrector Peter Norvig dan N-Gram pada kalimat Bahasa Indonesia memberikan 65,926% tingkat ketepatan menemukan satu saran kata. 2 Hasil kombinasi metode Spelling Corrector Peter Norvig dan N-Gram pada kalimat Bahasa Indonesia memberikan 78,07 tingkat keberhasilan menemukan satu saran kata. 3 Kombinasi kedua metode ini dapat digunakan dalam memperbaiki kesalahan pengetikan, walaupun tidak dapat memperbaiki kata dengan tingkat kesalahan dua huruf atau lebih. 4 Kombinasi kedua metode ini sangat bergantung pada korpus yang digunakan. Semakin baik korpus yang digunakan, maka semakin baik pula sistem menemukan kata yang relevan. B. Saran Saran untuk pengembangan penelitian ini antara lain 1 Kombinasi metode ini dikembangkan untuk memperbaiki dua atau lebih kata yang salah. 2 Kombinasi metode ini dikembangkan untuk dapat menggunakan nilai trigram dari kalimat uji, sehingga mampu memperbaiki kesalahan kata dengan memperhatikan frasa-frasa kalimat. 3 Aplikasi ini sangat bergantung pada kualitas dan kuantitas korpus sehingga diperlukan aplikasi yang dapat menghasilkan korpus dengan kualitas yang baik dan kuantitas yang tinggi. REFERENSI [1] Mishra, Ritika dan Navjot Kaur. 2013. A Survey of Spelling Error Detection and Correction Techniques. International Journal of Computer Trends and Technology Vol. 4, Issue 3. [2] Ratnasari, C. Indah. 2017. A Non-Word Error Spell Checker for Patient Complaints in Bahasa Indonesia. International Journal of Information Technology, Computer Science and Open Source Vol . 1, No. 1. [3] Fahma, A. Indana. 2018. Identifikasi Kesalahan Penulisan Kata Typographical Error pada Dokumen Berbahasa Indonesia Menggunakan Metode N-Gram dan Levensthein Distance. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol. 2, No. 1. [4] Fachrurrozi, Muhammad. 2015. Perbaikan Ejaan Kata pada Dokumen Bahasa Indonesia dengan Metode Cosine Similarity. Jurnal. Palembang Universitas Sriwijaya. [5] Mutammimah. 2017. Analisis Perbandingan Metode Spelling Corrector Peter Norvig dan Spelling Checker BK-Trees pada Kata Berbahasa Indonesia. Jurnal Edukasi dan Penelitian Informatika JEPIN Vol 5, No. 1. [6] Mandira, Soni. 2016. Perbaikan Probabilitas Lexical Model untuk Meningkatkan Akurasi Mesin Penerjemah Statistik. Jurnal Edukasi dan Penelitian Informatika JEPIN Vol 2, No. 1. [7] Hadi, Ibnu. 2014. Uji Akurasi Mesin Penerjemah Statistik Bahasa Indonesia ke Bahasa Melayu Sambas dan Mesin Penerjemahan Statistik Bahasa Melayu Sambas ke Bahasa Indonesia. Jurnal Sistem dan Teknologi Informasi JUSTIN Vol 2, No. 3. [8] Suprapto, Kadarisman Tejo Yuwono, Totok Sukardiyono, dan Adi Dewanto. 2008. Buku Bahasa Pemrograman Untuk SMK. Departemen Pendidikan Nasional Direktorat Pembinaan Sekolah Menengah Kejuruan [9] Pendit, P. L. 2008. Perpustakaan Digital dari A sampai Z. Jakarta Cita Karyakarsa Mandiri [10] Norvig, Peter. 2007. How to Write a Spelling Corrector. [Online] Available [11] Jurafsky, D. Saul. dan James H. Martin. 1999. Speech and Language Processing. USA Library of Congress Cataloging in Publication Data [12] Wardhana, W. Satya. 2011. Pengoreksian Ejaan Kata Menggunakan Metode N-Gram Studi Kasus Dokumen Teks Berbahasa Indonesia. Jurnal. Bandung Universitas Telkom [13] Hamzah, Amir. 2010. Deteksi Bahasa untuk Dokumen Teks Berbahasa Indonesia. Yogyakarta Seminar Nasional Informatika semnasIF 2010. ... A high accuracy value of classification meets value of 100%. The accuracy value of previous studies on text classification was above 60% in average [8] [12]. Through applying the combination of preprocessing techniques, it is expected that it can result a classification model with a higher accuracy. ...... This study used the combination of spelling correction and n-gram method and met the accuracy of 78,07% to produce one standard suggested word from one nonstandard word in a sentence [12]. The main obstacle in this study was mistyping in document caused by human error. ...... 6 Spelling Correction, this technique uses algorithm of Norvig spelling correction. The algorithm is able to give one suggested word and directly repairs it [12]. The algorithm of Peter Norvig combines the process of removing, adding, separating, replacing, and moving letter of nonstandard word. ... Triyas Hevianto SaputroArief HermawanSentiment analysis is a part of text mining used to dig up information from a sentence or document. This study focuses on text classification for the purpose of a sentiment analysis on hospital review by customers through criticism and suggestion on Google Maps Review. The data of texts collected still contain a lot of nonstandard words. These nonstandard words cause problem in the preprocessing stage. Thus, the selection and combination of techniques in the preprocessing stage emerge as something crucial for the accuracy improvement in the computation of machine learning. However, not all of the techniques in the preprocessing stage can contribute to improve the accuracy on classification machine. The objective of this study is to improve the accuracy of classification model on hospital review by customers for a sentiment analysis modeling. Through the implementation of the preprocessing technique combination, it can produce a highly accurate classification model. This study experimented with several preprocessing techniques 1 tokenization, 2 case folding, 3 stop words removal, 4 stemming, and 5 removing punctuation and number. The experiment was done by adding the preprocessing methods 1 spelling correction and 2 Slang. The result shows that spelling correction and Slang method can assist for improving the accuracy value. Furthermore, the selection of suitable preprocessing technique combination can fasten the training process to produce the more ideal text classification model.... However, some researchers combined N-gram with other methods. Ricky Martin et al. [6] and Maya Salinka Simanjuntak et al. [7] used N-gram and Peter Norvig method to correct Indonesian spelling. Imam Cholissodin and Rizal Setya Perdana used N-gram and Levenshtein Distance [8], whereas Dini Surianto et al. [9] used the N-gram method and Boyer Moore algorithm for typo identification. ...Typographical errors are common in written languages, including Indonesian. It will, however, lead to a misunderstanding of the meaning of the words. Nevertheless, an Indonesian spell checker is still uncommon. Furthermore, no extensive literature review of spell checkers for the Indonesian language has been conducted. This study aimed to present extensive literature on spelling correction in the Indonesian language. The methods used were discovering any literature related to the study topic for the period 2017-2022, applying some keywords, and enforcing inclusion and exclusion criteria. According to the findings of this study, in the previous five years, research on spell checkers has increased, and many researchers from various provinces in Indonesia have used different methods or algorithms to evaluate word Mandira Herry SujainiArif Bijaksana PutraBahasa merupakan alat komunikasi yang digunakan seseorang untuk menyampaikan ide, gagasan, konsep atau perasaan kepada orang lain. Ragam bahasa yang dimiliki setiap orang berbeda, hal ini dapat menghambat pertukaran informasi karena orang lain tidak memahami maksud dan tujuan yang ingin disampaikan. Mesin Penerjemah Statistik Statistical Machine Translation merupakan sebuah pendekatan mesin penerjemah dengan hasil terjemahan yang dihasilkan atas dasar model statistik yang parameter-parameternya diambil dari hasil analisis korpus paralel. Tujuan yang ingin dicapai dalam penelitian ini adalah melakukan perbaikan probabilitas lexical model pada mesin penerjemah statistik bahasa Jawa ke bahasa Indonesia untuk meningkatkan nilai akurasi hasil terjemahan. Pengujian dilakukan dengan membandingkan nilai akurasi hasil terjemahan sebelum dan setelah perbaikan probabilitas lexical model. Penelitian menggunakan korpus paralel sebanyak 5108 korpus. Pengujian dilakukan dengan dua cara, yaitu pengujian otomatis menggunakan Bilingual Evaluation Understudy BLEU dan pengujian oleh ahli bahasa Jawa. Hasil dari pengujian adalah terdapat peningkatan persentase nilai BLEU sebesar pada pengujian otomatis dan pada pengujian oleh ahli bahasa. Kata Kunci— BLEU score, korpus paralel, lexical model, mesin penerjemah statistik. Muhammad FachrurroziAnne Agustina ManikKesalahan ejaan kata dalam penulisan dokumen Bahasa Indonesia sering dijumpai sehingga sulit memahaminya. Penggunaan teknologi dalam memperbaiki kesalahan kata spelling checker telah banyak dilakukan. Pada penelitian ini dilakukan perbaikan kata pada dokumen bahasa Indonesia berbasis kemiripan kata menggunakan metode n-gram dan cosine similarity. Proses dimulai dengan melakukan pembentukan data latih dengan metode n-gram dalam pemotongan sejumlah kata. Pada proses pengujian dilakukan tahapan pra proses terlebih dahulu dan dilakukan pengecekan kata berdasarkan kamus kata dan data latih yang ada. Kata yang diasumsi salah dilakukan perbaikan kata dengan mencari kemiripan katanya dengan metode n-gram dan cosine similarity. Hasil kemiripan kata yang tertinggi disesuaikan dengan data latih, bila tidak sesuai maka kata dengan kemiripan tertinggi dianggap kata benar yang dilakukan perbaikan. Pada penelitian ini hasil percobaan dari 3 tingkatan kesalahan kata yaitu 20 %, 50 %, dan 70 % dengan masing-masing 20 dokumen menghasilkan perbaikan kata yang tepat diatas 70 %. Hasil penelitian dapat dilihat bahwa perbaikan kata sangat bergantung pada kamus kata trigram dan latih yang ada. Ini menunjukkan bahwa metode n-gram dan cosine similarity baik dalam penelitian ini. Kata Kunci— spelling checker, n-gram, cosine similarity. I. PENDAHULUAN Pembentuk struktur Bahasa Indonesia secara semantik adalah subjek, predikat, objek dan keterangan SPOK. Kesalahan makna tulisan salah satunya disebabkan oleh kesalahan dalam penulisan ejaan kata. Kesalahan dalam penulisan ini disebabkan kesalahan dalam pengetikan dokumen yang tidak sesuai dengan ejaan kata yang tepat. Dalam suatu dokumen terdiri dari kumpulan beberapa kalimat. Kalimat adalah satuan bahasa terkecil dalam wujud lisan atau tulisan yang mengungkapkan pikiran yang utuh [1]. Kalimat terdiri dari kumpulan urutan kata yang berkesinambungan antara yang satu dengan yang lain, yang menyampaikan suatu informasi sehingga diperlukan ejaan kata yang tepat dalam urutan kata dalam kalimat. Ejaan kata yang tepat dibentuk berdasarkan proses morfologi yang tepat. Perbaikan dokumen yang dikerjakan merupakan hal yang penting dilakukan untuk menghindari dalam kesalahan ejaan kata. Namun dalam pelaksanaanya hal ini jarang dilakukan dikarenakan pengecekan secara berulang-ulang yang memakan waktu dan tenaga untuk mendapatkan ejaan kata yang benar. Salah satu solusi untuk menyelesaikan masalah ini adalah dengan menggunakan sistem yang mampu memperbaiki kata secara otomatis. Pada penelitian ini metode yang digunakan dalam perbaikan kata pada dokumen dengan menggunakan N-gram dan cosine similarity. Penelitian ini bertujuan untuk menerapkan metode yang digunakan dalam perbaikan kata pada dokumen bahasa Indonesia serta melihat akurasi metode tersebut dalam sistem ini. Dari sistem yang dibuat ini diharapkan dapat menghasilkan ejaan kata yang tepat pada dokumen bahasa Indonesia dengan metode Cosine Similarity sesuai dengan data asli yang diasumsi tidak ada yang salah. II. TINJAUAN PUSTAKA A. Spelling Checker Spelling checker adalah proses pemeriksaan kata untuk mendeteksi kata yang salah eja dan memberikan kandidat kata yang benar. Kesalahan ejaan terdapat dua kategori yaitu [2] a. Kesalahan non kata Kesalahan ejaan non kata adalah kesalahan yang berfokus pada kata yang terbentuk umumnya oleh kesalahan pengetikan. Kesalahan ejaan non kata ini menghasilkan kata-kata yang tidak masuk akal. b. Kesalahan kata yang sebenarnya Kesalahan kata yang sebenarnya adalah kesalahan yang menekankan pada penanganan penempatan kata dalam kalimat. Kesalahan kata yang sebenarnya menghasilkan kata sah lainnya. Desain dari proses Spelling checker yang dilakukan yaitu [2] 1. Melakukan pengolahan pra proses pada teks 2. Lalu memeriksa setiap kata apakah kata salah atau tidak. 3. Selanjutnya tahapan memperbaiki kata untuk mendapatkan kata yang benar. B. N-Gram N-gram adalah potongan sejumlah n karakter dari sebuah string yang diaplikasikan untuk pembangkitan kata atau karakter. Metode n-gram ini digunakan untuk mengambilA Survey of Spelling Error Detection and Correction TechniquesRitika MishraDan NavjotKaurMishra, Ritika dan Navjot Kaur. 2013. A Survey of Spelling Error Detection and Correction Techniques. International Journal of Computer Trends and Technology Vol. 4, Issue Non-Word Error Spell Checker for Patient Complaints in Bahasa IndonesiaC RatnasariIndahRatnasari, C. Indah. 2017. A Non-Word Error Spell Checker for Patient Complaints in Bahasa Indonesia. International Journal of Information Technology, Computer Science and Open Source Vol. 1, No. Kesalahan Penulisan Kata Typographical Error pada Dokumen Berbahasa Indonesia Menggunakan Metode N-Gram dan Levensthein DistanceA FahmaIndanaFahma, A. Indana. 2018. Identifikasi Kesalahan Penulisan Kata Typographical Error pada Dokumen Berbahasa Indonesia Menggunakan Metode N-Gram dan Levensthein Distance. Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer Vol. 2, No. Perbandingan Metode Spelling Corrector Peter Norvig dan Spelling Checker BK-Trees pada Kata Berbahasa IndonesiaMutammimahMutammimah. 2017. Analisis Perbandingan Metode Spelling Corrector Peter Norvig dan Spelling Checker BK-Trees pada Kata Berbahasa Indonesia. Jurnal Edukasi dan Penelitian Informatika JEPIN Vol 5, No. Akurasi Mesin Penerjemah Statistik Bahasa Indonesia ke Bahasa Melayu Sambas dan Mesin Penerjemahan Statistik Bahasa Melayu Sambas ke Bahasa IndonesiaIbnu HadiHadi, Ibnu. 2014. Uji Akurasi Mesin Penerjemah Statistik Bahasa Indonesia ke Bahasa Melayu Sambas dan Mesin Penerjemahan Statistik Bahasa Melayu Sambas ke Bahasa Indonesia. Jurnal Sistem dan Teknologi Informasi JUSTIN Vol 2, No. Bahasa Pemrograman Untuk SMK. Departemen Pendidikan Nasional Direktorat Pembinaan Sekolah Menengah KejuruanKadarisman SupraptoTotok Tejo YuwonoSukardiyonoAdi DanDewantoSuprapto, Kadarisman Tejo Yuwono, Totok Sukardiyono, dan Adi Dewanto. 2008. Buku Bahasa Pemrograman Untuk SMK. Departemen Pendidikan Nasional Direktorat Pembinaan Sekolah Menengah KejuruanPerpustakaan Digital dari A sampai Z. Jakarta Cita Karyakarsa MandiriP L PenditPendit, P. L. 2008. Perpustakaan Digital dari A sampai Z. Jakarta Cita Karyakarsa MandiriHow to Write a Spelling CorrectorPeter NorvigNorvig, Peter. 2007. How to Write a Spelling Corrector. [Online] Available

pengejaan spelling untuk huruf h adalah