Kemajuan pembelajaran yang dalam meningkatkan visi komputer – tetapi masih ada batasan yang jelas

Kemajuan pembelajaran yang dalam meningkatkan visi komputer – tetapi masih ada batasan yang jelas

 

Kemajuan pembelajaran yang dalam meningkatkan visi komputer - tetapi masih ada batasan yang jelas
Kemajuan pembelajaran yang dalam meningkatkan visi komputer – tetapi masih ada batasan yang jelas

Artikel ini adalah bagian dari Demystifying AI, serangkaian posting yang (mencoba) mengacaukan jargon dan mitos seputar AI.

Sejak awal kecerdasan buatan, para ilmuwan komputer telah bermimpi menciptakan mesin yang dapat melihat dan memahami dunia seperti yang kita lakukan. Upaya telah menyebabkan munculnya visi komputer, subbidang luas AI dan ilmu komputer yang berhubungan dengan pemrosesan konten data visual.

Dalam beberapa tahun terakhir, visi komputer telah mengambil lompatan besar berkat kemajuan dalam pembelajaran yang mendalam dan jaringan saraf tiruan. Pembelajaran mendalam adalah cabang AI yang sangat baik dalam memproses data yang tidak terstruktur seperti gambar dan video.

Kemajuan ini telah membuka jalan untuk meningkatkan penggunaan visi komputer di domain yang ada dan memperkenalkannya ke domain baru. Dalam banyak kasus, algoritma visi komputer telah menjadi komponen yang sangat penting dari aplikasi yang kita gunakan setiap hari.
Beberapa catatan tentang kondisi visi komputer saat ini

Sebelum menjadi terlalu bersemangat tentang kemajuan dalam visi komputer, penting untuk memahami batas-batas teknologi AI saat ini. Meskipun peningkatannya signifikan, kami masih sangat jauh dari memiliki algoritma penglihatan komputer yang dapat memahami foto dan video dengan cara yang sama seperti manusia.

Untuk saat ini, jaringan saraf yang dalam, daging-dan-kentang dari sistem visi komputer, sangat baik dalam mencocokkan pola pada tingkat piksel. Mereka sangat efisien dalam mengklasifikasikan gambar dan melokalisasi objek dalam gambar. Tetapi ketika datang untuk memahami konteks data visual dan menggambarkan hubungan antara objek yang berbeda, mereka gagal total.

Pekerjaan terbaru yang dilakukan di lapangan menunjukkan batasan algoritma penglihatan komputer dan kebutuhan akan metode evaluasi baru. Meskipun demikian, aplikasi saat ini dari visi komputer menunjukkan seberapa banyak yang dapat dicapai dengan pencocokan pola saja. Di pos ini, kami akan menjelajahi beberapa aplikasi ini, tetapi kami juga akan membahas batasannya.
Aplikasi komersial dari visi komputer

Anda menggunakan aplikasi visi komputer setiap hari, mungkin tanpa memperhatikannya dalam beberapa kasus. Berikut ini adalah beberapa aplikasi visi komputer yang praktis dan populer yang menjadikan hidup menyenangkan dan nyaman.
Pencarian gambar

Salah satu area di mana visi komputer telah membuat kemajuan besar adalah klasifikasi gambar dan deteksi objek. Jaringan saraf yang dilatih tentang data berlabel cukup akan dapat mendeteksi dan menyoroti berbagai objek dengan akurasi yang mengesankan.

Beberapa perusahaan yang cocok dengan penyimpanan data pengguna Google yang luas. Dan perusahaan telah menggunakan repositori data pengguna yang hampir tak terbatas (dan terus bertambah) untuk mengembangkan beberapa model AI yang paling efisien. Saat Anda mengunggah foto di Foto Google, ia menggunakan algoritme visi komputer untuk memberi anotasi dengan informasi konten tentang adegan, objek, dan orang. Anda kemudian dapat mencari gambar Anda berdasarkan informasi ini.

Misalnya, jika Anda mencari “anjing,” Google akan secara otomatis mengembalikan semua gambar di perpustakaan

Anda yang berisi anjing.

pencarian gambar foto google
Google menggunakan pembelajaran mesin dan visi komputer untuk mencari konten gambar bahkan jika Anda belum menandainya.

Namun, pengenalan gambar Google tidak sempurna. Dalam satu kejadian, algoritma visi komputer secara keliru menandai gambar dua orang berkulit gelap sebagai “gorila,” yang menyebabkan rasa malu bagi perusahaan.

Google juga menggunakan visi komputer untuk mengekstraksi teks dari gambar di perpustakaan Anda, Drive, dan lampiran Gmail. Misalnya, ketika Anda mencari istilah di kotak masuk Anda, Gmail juga akan melihat teks dalam gambar. Beberapa waktu yang lalu, saya mencari alamat rumah saya di Gmail dan mendapat email dengan lampiran gambar yang berisi paket Amazon dengan alamat saya di dalamnya.

Baca: [AI membantu menghilangkan paparan radiasi dalam skrining kanker payudara]
Pengeditan dan peningkatan gambar

Banyak perusahaan sekarang menggunakan pembelajaran mesin untuk memberikan peningkatan otomatis pada foto.

Garis telepon Pixel Google menggunakan jaringan saraf pada perangkat untuk melakukan peningkatan otomatis seperti penyeimbangan putih dan menambahkan efek seperti mengaburkan latar belakang.

Peningkatan luar biasa lainnya yang kemajuan dalam visi komputer telah mengantarkan adalah zoom pintar. Fitur pembesaran tradisional biasanya membuat gambar buram karena mereka mengisi area yang diperbesar dengan interpolasi antar piksel. Alih-alih memperbesar piksel, zoom berbasis visi komputer berfokus pada fitur seperti tepi, pola. Pendekatan ini menghasilkan gambar yang lebih tajam.

Banyak startup dan perusahaan grafis yang sudah lama beralih ke pembelajaran mendalam untuk membuat peningkatan pada gambar dan video. Teknologi Enhance Details dari Adobe, yang ditampilkan di Lightroom CC, menggunakan pembelajaran mesin untuk membuat gambar yang diperbesar dengan lebih tajam.

pembelajaran mesin peningkatan gambar adobe lightroom

Adobe menggunakan pembelajaran mendalam untuk meningkatkan detail gambar yang diperbesar.

Alat pengeditan gambar Pixelmator Pro menampilkan fitur Resolusi Super ML, yang menggunakan jaringan saraf convolutional untuk memberikan pembesaran dan peningkatan yang tajam.
Reco wajah

Sumber:

https://blog.fe-saburai.ac.id/jasa-penulis-artikel-tukangkonten-com/