Pengenalan pola diperlukan dalam pemikiran komputasi. Pengenalan pola adalah kemampuan untuk mengidentifikasi persamaan atau bahkan perbedaan pola, tren, dan keteraturan dalam data, yang kemudian digunakan untuk membuat prediksi dan menyajikan data. Contoh aplikasi yang menggunakan pengenalan pola adalah:
a. Machine Vision
Machine Vision (VM) adalah teknologi dan metode yang digunakan untuk menyediakan inspeksi dan analisis berbasis gambar otomatis untuk aplikasi seperti inspeksi otomatis, kontrol proses, dan panduan robot di industri.
Machine vision merupakan teknologi untuk inspeksi otomatis berbasiskan image, misalnya pada:
1) Pengontrolan proses industri
2) Pendeteksi nomor plat kendaraan
3) Wood quality inspection
4) Final inspection of sub-assemblies
5) Engine part inspection
6) Label inspection on products
7) Checking medical devices for defects
8) 3D model building (photogrammetry)
9) Robot Vision
10) Surveillance (monitor penyusup, analisa trafik jalan tol dan lainnya)
11) Interaksi manusia dan robot (Human Robot Interaction)
Dalam penerapannya, Computer Vision menerapkan pengolahan citra digital untuk menerapkan algoritma komputer untuk pengolahan citra menjadi citra digital. Menurut Forsyth dan Ponce, visi komputer mengekstrak deskripsi dunia dari gambar atau urutan gambar. Visi komputer secara umum adalah area yang mencakup metode akuisisi. Prosesor menganalisis dan memahami gambar untuk menghasilkan informasi numerik atau simbolis. Pemrosesan citra adalah proses mengubah citra 2D menggunakan deteksi tepi, transformasi Fourier, atau teknik peningkatan untuk mendapatkan keluaran citra 2D yang diinginkan (misalnya, penghalusan citra).
Setelah image diperoleh lalu diproses, Metode Machine Vision antara lain:
1) Stitching/Registration Menggabungkan gambar 2D atau 3D yang berdekatan.
2) Penyaringan (misalnya penyaringan morfologis).
3) Thresholding Thresholding dimulai dengan pengaturan atau penentuan nilai keabuan, yang berguna untuk langkah-langkah selanjutnya. Nilai ini kemudian digunakan untuk memisahkan bagian-bagian gambar dan terkadang mengubah bagian mana pun dari gambar menjadi hitam putih tergantung apakah nilainya di bawah atau di atas nilai skala abu-abu.
4) Penghitungan piksel menghitung jumlah piksel terang atau gelap.
5) Segmentasi Memecah citra digital menjadi segmen-segmen untuk menyederhanakan penyajian citra dan/atau mengubahnya menjadi sesuatu yang lebih bermakna dan lebih mudah dianalisis.
6) Lukisan
7) Deteksi tepi menemukan tepi objek.
8) Analisis Warna Gunakan warna untuk mengidentifikasi bagian, produk, dan item, menilai kualitas warna, dan menggunakan warna untuk mengisolasi fitur.
9) Penemuan & manipulasi gumpalan memeriksa gambar untuk gumpalan diskrit dari piksel yang terhubung (misalnya lubang hitam di objek abu-abu) sebagai penanda gambar. Gumpalan ini sering mewakili target optik untuk permesinan, penangkapan robot, atau kegagalan manufaktur.
10) Pengenalan pola termasuk pencocokan template. Menemukan, mencocokkan, dan/atau menghitung pola tertentu. Ini mungkin termasuk lokasi objek yang dapat diputar, sebagian disembunyikan oleh objek lain, atau ukurannya bervariasi.
11) Pembacaan Barcode, Data Matrix dan "2D barcode"
Output yang umum dari Machine Vision adalah keputusan lulus / gagal. Aplikasi terbaru termasuk Sistem Industri HP dan Robot Vision, di mana robot dapat melihat menggunakan kamera dan unit pendukung dalam bentuk sensor dan kontrol berkecepatan tinggi
b. Optical Character Recognition (OCR)
Optical Character Recognition (OCR) adalah proses mengubah gambar huruf menjadi karakter ASCII yang dikenali oleh komputer. Gambar dari surat-surat yang dimaksud dapat berupa scan dokumen, screen untuk mencetak halaman web, foto dan lain-lain (Mohammad, Anarase, Shingote and Ghanwat, 2014).
Salah satu alasan mengapa gambar huruf perlu diubah menjadi karakter ASCII adalah karena karakter ASCII memiliki ruang penyimpanan yang lebih sedikit. Misalnya, paragraf dicetak di layar dan disimpan dalam format PNG. Paragraf juga disalin dan disimpan .txt . Ini adalah 42 KB untuk file gambar, sedangkan 1 KB untuk file teks. Ini menunjukkan kepada Anda bahwa file gambar selalu relatif lebih besar daripada menyimpan teks ASCII secara langsung.
OCR adalah sistem yang sudah lama dikembangkan. Pada tahun 1914, Emanuel Goldberg mulai mengembangkan sistem OCR yang bekerja untuk telegram dan pembaca untuk orang tunanetra. Sistem OCR terus berkembang untuk mencapai presisi yang lebih baik bahkan dalam situasi di mana karakter sulit untuk diidentifikasi.
Aplikasi OCR sendiri memungkinkan komputer untuk melakukan pemrosesan tambahan, misalnya terjemahan bahasa asing, pencarian, sistem pembacaan otomatis untuk tunanetra, entri data, pengenalan karakter seperti plat nomor, tes CAPTCHA atau masalah teks lainnya.
Hasil OCR dapat disimpan dalam format ASCII, tetapi dalam kasus tertentu perlu menyimpan desain. Layout adalah penempatan paragraf, margin, dan lain-lain agar sama persis dengan gambar yang diproses. misalnya saat mengonversi buku yang dipindai ke .doc, tentu saja posisi paragraf dan lainnya harus sama. Layout disimpan dalam format XML (Extended Markup Language) bernama ALTO (Analyzed Layout and Text Object) yang dokumentasinya dapat ditemukan di http://www.loc.gov/standards/alto/ .
c. Computer Aided Diagnosis
Computer aided diagnosis (CAD) adalah data yang dihasilkan oleh komputer untuk membantu dokter membuat diagnosis. Berbeda dengan diagnostik komputer otomatis, di mana diagnosis akhir hanya didasarkan pada algoritma komputer.
Sistem diagnostik terkomputerisasi telah banyak digunakan dalam radiologi selama 1-3 tahun. Penggunaan yang paling umum adalah deteksi kanker payudara pada mamografi dan nodul paru pada CT 3 dada. Sistem ini secara tradisional didasarkan pada rekayasa fungsional manual berdasarkan pengetahuan utama, tetapi pendekatan yang lebih maju menggunakan machine learning untuk menemukan properti laten dalam data gambar. Istilah ini sering digunakan secara luas untuk computer aided detection dan computer aided diagnosis.
- computer aided detection (CADe): menandai area gambar tertentu yang mungkin tampak tidak normal, dirancang untuk mengurangi risiko hilangnya patologi yang menarik.
- computer aided diagnosis (CADx): membantu seorang praktisi menilai dan mengklasifikasikan patologi dalam gambar medis.
d. Speech Recognition
Speech Recognition atau yang biasa dikenal dengan automatic speech recognition (ASR) adalah pengembangan teknik dan sistem yang memungkinkan komputer menerima informasi dalam bentuk kata-kata yang diucapkan. Teknologi ini memungkinkan
perangkat untuk mengenali dan memahami kata-kata
yang diucapkan dengan mendigitalkan kata-kata dan mencocokkan sinyal digital
dengan pola tertentu yang tersimpan
dalam perangkat. Kata yang diucapkan diubah menjadi sinyal digital dengan mengubah gelombang suara menjadi
serangkaian angka, yang kemudian diberi kode khusus untuk mengidentifikasi kata-kata
tersebut. Hasil identifikasi kata-kata yang diucapkan
dapat ditampilkan dalam bentuk tulisan
atau dibaca oleh perangkat teknis sebagai perintah
untuk menyelesaikan suatu
tugas, misalnya menekan tombol pada ponsel, yang dilakukan secara otomatis dengan
perintah suara.
Sejarah perkembangan speech recognition dimulai pada tahun 1952 dengan ditemukannya Audrey (automatic digit recognizer) oleh Bell Laboratories, yang dapat mengenali suara angka. Namun pada tahun 1962 teknologi shoebox dikembangkan, dimana teknologi tersebut dapat memahami 16 kata. ,
9 konsonan dan 4 vokal dalam bahasa Inggris. Kemudian, pada tahun 1970-an, Departemen Pertahanan AS memberikan kontribusi yang signifikan terhadap pengembangan speech recognition dengan program DARPA SUR (Speech Comprehension Research), yang menghasilkan sistem yang dapat memahami 1011 kata dan frasa logis dalam bahasa Inggris. Terobosan lain pada 1980-an adalah pengembangan Model Hidden Markov, yang menggunakan statistik untuk menentukan probabilitas bahwa sebuah kata akan berasal dari suara yang tidak diketahui. Sistem itu dibawa ke dalam boneka untuk anak-anak bernama Julie. Boneka dilatih dalam kemampuan merespon bahasa, tetapi masih ada kelemahan yang menghentikan kata yang diucapkan. Kemudian, pada 1990-an, perusahaan bernama DRAGON merilis speech recognition software pertama di dunia yang disebut Dragon Naturally Speaking, yang memungkinkan kita berbicara 100 kata dalam 1 menit. Sedangkan pada tahun 2000-an hingga saat ini, perkembangan speech recognition dengan dukungan teknologi canggih terus berlanjut. Salah satu aplikasi speech recognition yang dikenal saat ini adalah munculnya aplikasi pencarian suara Google yang diluncurkan oleh Google untuk iPhone, yang menggunakan pusat data untuk menghitung sejumlah besar analisis data yang diperlukan untuk pencocokan permintaan pengguna dengan sampel bahasa manusia.
kata-kata yang diucapkan. Teknologi ini memungkinkan perangkat untuk mengenali dan memahami kata-kata yang diucapkan dengan mendigitalkan kata-kata dan mencocokkan sinyal digital dengan pola tertentu yang tersimpan dalam perangkat. Kata yang diucapkan diubah menjadi sinyal digital dengan mengubah gelombang suara menjadi serangkaian angka, yang kemudian diberi kode khusus untuk mengidentifikasi kata-kata tersebut. Hasil identifikasi kata-kata yang diucapkan dapat ditampilkan dalam bentuk tulisan atau dibaca oleh perangkat teknis sebagai perintah untuk menyelesaikan suatu tugas, misalnya menekan tombol pada ponsel, yang dilakukan secara otomatis dengan perintah suara.
Sejarah perkembangan speech recognition dimulai pada tahun 1952 dengan ditemukannya Audrey (automatic digit recognizer) oleh Bell Laboratories, yang dapat mengenali suara angka. Namun pada tahun 1962 teknologi shoebox dikembangkan, dimana teknologi tersebut dapat memahami 16 kata. ,
9 konsonan dan 4 vokal dalam bahasa Inggris. Kemudian, pada tahun 1970-an, Departemen Pertahanan AS memberikan kontribusi yang signifikan terhadap pengembangan speech recognition dengan program DARPA SUR (Speech Comprehension Research), yang menghasilkan sistem yang dapat memahami 1011 kata dan frasa logis dalam bahasa Inggris. Terobosan lain pada 1980-an adalah pengembangan Model Hidden Markov, yang menggunakan statistik untuk menentukan probabilitas bahwa sebuah kata akan berasal dari suara yang tidak diketahui. Sistem itu dibawa ke dalam boneka untuk anak-anak bernama Julie. Boneka dilatih dalam kemampuan merespon bahasa, tetapi masih ada kelemahan yang menghentikan kata yang diucapkan. Kemudian, pada 1990-an, perusahaan bernama DRAGON merilis speech recognition software pertama di dunia yang disebut Dragon Naturally Speaking, yang memungkinkan kita berbicara 100 kata dalam 1 menit. Sedangkan pada tahun 2000-an hingga saat ini, perkembangan speech recognition dengan dukungan teknologi canggih terus berlanjut. Salah satu aplikasi speech recognition yang dikenal saat ini adalah munculnya aplikasi pencarian suara Google yang diluncurkan oleh Google untuk iPhone, yang menggunakan pusat data untuk menghitung sejumlah besar analisis data yang diperlukan untuk pencocokan permintaan pengguna dengan sampel bahasa manusia.
Berdasarkan kemampuan dalam mengenal kata yang diucapkan, terdapat 5 jenis pengenalan kata, yaitu:
a) Kata-kata yang terisolasi : Proses mengidentifikasi kata-kata yang hanya dapat mengenali kata yang diucapkan ketika kata tersebut memiliki jarak waktu antar kata.
b) Kata-kata yang berhubungan : Proses pengidentifikasian kata yang mirip dengan kata-kata terisolasi, namun membutuhkan jeda waktu pengucapan antar kata yang lebih singkat
c) Kata-kata yang berkelanjutan: Proses pengidentifikasian kata yang sudah lebih maju karena dapat mengenali kata-kata yang diucapkan terus menerus dengan sedikit atau tanpa jeda. Proses pengenalan ucapan ini sangat rumit karena memerlukan metode khusus untuk membedakan kata-kata yang diucapkan tanpa jeda waktu. Pengguna perangkat ini dapat mengucapkan kata-kata secara natural
d) Kata-kata spontan : Proses pengidentifikasian kata yang dapat mengenal kata-kata yang diucapkan secara spontan tanpa jeda waktu antar kata
e) Verifikasi atau identifikasi suara : Proses pengidentifikasian kata yang tidak hanya mampu mengenal kata, namun juga mengidentifikasi siapa yang berbicara.
Tidak ada komentar:
Posting Komentar