Priyadi’s Place

« Previous post

Algoritma Fonetik Bahasa Indonesia

Posted under:

At Work
Linguistics
Software

at 23:48

Algoritma fonetik adalah algoritma untuk mengelompokkan kata-kata berdasarkan cara pengucapannya. Jika fungsi F() adalah sebuah algoritma fonetik, maka F(“andy”) akan memiliki hasil yang sama dengan F(“andi”), karena ‘andy’ dan ‘andi’ memiliki cara pengucapan yang sama. Untuk Bahasa Inggris, algoritma yang populer adalah Soundex dan Metaphone.

Bagaimana dengan Bahasa Indonesia?

Algoritma fonetik untuk Bahasa Indonesia seharusnya jauh lebih sederhana daripada algoritma fonetik untuk Bahasa Inggris karena Bahasa Indonesia adalah bahasa yang fonetik: pengucapannya relatif konsisten dengan penulisan. Algoritma metaphone seharusnya dapat dimodifikasi menjadi jauh lebih sederhana untuk dapat digunakan dalam Bahasa Indonesia.

Tetapi karena saya terlalu malas untuk mempelajarinya, berikut adalah algoritma fonetik Bahasa Indonesia tanpa basisdata hasil rekaan dari saya sendiri:

Ubah ejaan lama menjadi ejaan baru: ubah oe menjadi u, tj menjadi c, dj menjadi j. Untuk menghindari false positive, jangan ubah j menjadi y kecuali jika ada pengubahan ejaan lama menjadi ejaan baru yang lain. Hati-hati dengan urutan pengubahan, jangan sampai dj berubah menjadi y.
Ganti konsonan yang berderet menjadi satu konsonan saja. Misalnya ‘anni’ menjadi ‘ani’.
Normalkan diftong: ubah ai di akhir kata menjadi ay, au di akhir kata menjadi aw dan oi di akhir kata menjadi oy.
Normalkan semivokal: ubah konsonan-y menjadi konsonan-i, iy menjadi i dan uw menjadi u
Normalkan konsonan yang berbunyi nyaris sama: ubah kh dan q menjadi k, sy menjadi s, v menjadi f, z menjadi j, d menjadi t, b menjadi p (mungkin masih ada yang kurang atau salah).
Normalkan ‘x’: ubah x menjadi ks
Ubah konsonan compound yang tersisa menjadi satu karakter: ng menjadi d dan ny menjadi b.
Normalkan h diam: ubah konsonan-h-vokal menjadi konsonan-vokal saja.
Hapus semua huruf vokal.

Untuk memuaskan ego saya, maka algoritma yang sama sekali belum pernah dicoba ini saya namakan: Algoritma Priyadi™. Ha! >:)

Khusus untuk nama orang, mungkin akan lebih baik jika algoritma fonetik Bahasa Indonesia (apapun algoritmanya, tentunya bukan Algoritma Priyadi™) dicampur dengan algoritma fonetik Bahasa Inggris. Hal ini akibat banyaknya nama orang Indonesia yang menganut pengucapan Bahasa Asing.

Selain itu, karena Bahasa Indonesia relatif sangat fonetik, kemiripan pengucapan bisa saja berbanding terbalik dengan jarak Levenshtein. Semakin mirip pengucapan dua buah kata, maka semakin dekat jarak Levenshtein-nya. Hanya saja, metoda ini akan membutuhkan tempat penyimpanan yang jauh lebih besar daripada jika menggunakan algoritma fonetik.

Mungkin saya sedang reinventing the wheel. Mungkin sudah ada algoritma lain yang lebih baik dan tentunya lebih terbukti? Atau mungkin sudah ada yang sudah mempelajari efektivitas algoritma fonetik Bahasa Inggris jika diterapkan pada Bahasa Indonesia? Jika belum ada, mungkin ini topik yang baik untuk tugas akhir mahasiswa S1 teknik atau sastra.

Pesan saya, namakan algoritma anda dengan nama anda sendiri, jangan nama dosen pembimbing anda, kecuali kalau nama anda adalah ‘Priyadi’ :D.

46 Responses

Trackback: Use this URI to trackback this entry. Use your web browser's function to copy it to your blog posting.

Comment RSS: You can track conversation in this page by using this page's Comments RSS

Gravatar: You can have a picture next to each of your comments by getting a Gravatar.

1

if (PriyadiAlgorithm(“Roy Suryo”)==PriyadiAlgorithm(“Roi Soerjo”)) {
printf(“Horeeeee!!!!”);
}

:D
- Comment by obyektif
- Posted from Someren Netherlands
- 22 December 2005 at 01:00
2

yah…kedua…:(
- Comment by dani
- Posted from Yogyakarta Indonesia
- 22 December 2005 at 01:54
3

mmm..anne jd ane :)..priyadi jd priadi..:)
- Comment by dani
- Posted from Yogyakarta Indonesia
- 22 December 2005 at 02:00
4

Tapi… bagaimana kalau nama dosennya: Priyadi? :D
- Comment by wông gragé
- Posted from Kaiserslautern Germany
- 22 December 2005 at 02:17
5

kalo algoritma/kaidah “Unsur Serapan” dari bhs asing ke bhs Indonesia, ada tuh.

eh..nyambung nggak ya :-?
- Comment by daon
- Posted from Jakarta Pusat Indonesia
- 22 December 2005 at 03:12
6

Coool :)>-
- Comment by Jauhari
- Posted from Jakarta Pusat Indonesia
- 22 December 2005 at 04:35
7

…maka F(”andy”) akan memiliki hasil yang sama dengan F(”andi”), karena ‘andy’ dan ‘andi’ memiliki cara pengucapan yang sama.

Wah, tumben gue ke pilem :-??
- Comment by kang Andy
- Posted from Bandar Seri Begawan Brunei Darussalam
- 22 December 2005 at 04:40
8

Coba cari2 yg bahasa Italian Pri, mungkin bisa diadaptasi, soale rada mirip2.
- Comment by Ronny
- Posted from Telegraph Point Australia
- 22 December 2005 at 06:05
9

keren
- Comment by aRdho
- Posted from Amsterdam Netherlands
- 22 December 2005 at 07:44
10

“jangan ubah j menjadi y kecuali jika ada pengubahan ejaan lama menjadi ejaan baru yang lain.”

yulian adalah jay menjadi yulian adalah yay … hi..hi…

#-o
- Comment by j
- Posted from Jakarta Indonesia
- 22 December 2005 at 08:08
11

Agar sejalan dengan algoritma ini bagaimana kalau ejaan bahasa Indonesia disempurnakan sekali lagi (EYD tahap 2).
- Comment by yoyoimut
- Posted from Japan
- 22 December 2005 at 08:33
12

#10 Hi YAY (Hi Jay maksudnyah) :x
- Comment by abe
- Posted from Jakarta Indonesia
- 22 December 2005 at 09:18
13

pak pri hmmmmssss
cerdas…….
pintar…..
matang…
mapan……
sosok pria yg mendekati kesempurnaan.
btw, anda bukan anggota lsm-kan?…
yg bergerak kalo ada titipan :d
- Comment by ucok
- Posted from Kurashiki Japan
- 22 December 2005 at 09:29
14

doeljoni harusnya duljoni donk
:)>-
- Comment by doeljoni
- Posted from Surabaya Indonesia
- 22 December 2005 at 09:52
15

#13: heh, salah dong. kalo ‘jay adalah yulian’ gak berubah jadi ‘yay adalah yulian’, beda kalau ‘jay adalah joelian’, maka berubah jadi ‘yay adalah yulian’.
- Comment by Priyadi
- Posted from Jakarta Pusat Indonesia
- 22 December 2005 at 10:09
16

—–
Normalkan diftong: ubah ai menjadi ay, au menjadi aw dan oi menjadi oy.
—–

1. baik menjadi bayk? (bayek)
2. baur menjadi bawr? (bawer)
- Comment by mbah dukun
- Posted from Tokyo Japan
- 22 December 2005 at 10:27
17

/:) mumet aku?????
- Comment by Joey
- Posted from Kwai Chung Hong Kong
- 22 December 2005 at 10:34
18

#16: hmm, gimana ya cara bedain diftong dan vokal yang terpisah. jangan2 harus pakai database juga :(
- Comment by Priyadi
- Posted from Jakarta Pusat Indonesia
- 22 December 2005 at 10:49
19

#18, mestinya pakai database.

Tapi gue heran, kok omPri gak pake contoh “standar”. Misalnya dalam paragraf pertama:

>Jika fungsi F() adalah sebuah algoritma fonetik,
>maka F(”andy”) akan memiliki hasil yang sama
>dengan F(”andi”), karena ‘andy’ dan ‘andi’
>memiliki cara pengucapan yang sama.

Mestinya ditulis
>Jika fungsi F() adalah sebuah algoritma fonetik,
>maka F(”roy”) akan memiliki hasil yang sama
>dengan F(”roi”), karena ‘roy’ dan ‘roi’
>memiliki cara pengucapan yang sama.

Atau sebagai contoh di point 1:
>Ubah ejaan lama menjadi ejaan baru:
>ubah oe menjadi u

Maka F(“Roy Soeryo”) akan sama dengan F(“Roi Suryo”).

Dengan begini artikel omPri akan 68% lebih baik daripada yang sekarang. Sekarang ini gue kira nilai untuk artikel omPri hanya 68. Karena 68% dari isi artikel itu cuma menunjukkan omPri lagi kurang kerjaan, seperti halnya 68% dari komentator di blog ini :d
- Comment by mencreto
- Posted from Yogyakarta Indonesia
- 22 December 2005 at 12:26
20

busted! polisiEYD wannabe! hihihihi..
oke deh.. algoritma priyadi™ saya simpan,
untuk bahan cerita ke anak cucu. :D
- Comment by lantip
- Posted from Yogyakarta Indonesia
- 22 December 2005 at 12:54
21

hmmm…
jadi inget orang-orang latin
yang berbahasa Inggris,
di pilem-pilem Huliwud.

kata orang,
bahasa itu untuk memudahkan,
untuk memahami,
jadi ksimpulannya :
gunakan bahasa dengan menikmatinya.

:o

Hi Pri! ™
salam kenal.
- Comment by ullilkecil
- Posted from Jakarta Indonesia
- 22 December 2005 at 14:29
22

Algoritma Priyadi :-? keren tuh, ngikut ah..
- Comment by ieronoriron
- Posted from Jakarta Indonesia
- 22 December 2005 at 14:54
23

Bagaimana kalau EYD disempurnakan sekali lagi supaya algoritma ini menjadi lebih mudah untuk dipakai?
- Comment by yoyoimut
- Posted from Japan
- 22 December 2005 at 15:42
24

kok beda ya sama pelajaran algoritma yang gw dapet di kampus !
- Comment by odir
- Posted from El Segundo United States
- 22 December 2005 at 17:12
25

Mulay sekarang URLku dah ganti Oom, kalaw bisa disewaikan ya (yang di sidebar pakay yang baru..) \:d/
- Comment by Tina
- Posted from Roggenburg Germany
- 22 December 2005 at 17:36
26

algoritma yang ganteng, sama ama yang bikin.. :x
- Comment by keqi
- Posted from Jakarta Indonesia
- 22 December 2005 at 17:40
27

#19
=))
68% gw setubuh ama lu :))

btw, ohm pri dah baca tulisan idban barusan ???
- Comment by paydjo
- Posted from Yogyakarta Indonesia
- 22 December 2005 at 19:08
28

Asli gw jadi ingat pelajaran jaman SMP :))
- Comment by ID
- Posted from Makassar Indonesia

Changing the world, one person at a time…

21 December 2005

Algoritma Fonetik Bahasa Indonesia

46 Responses