|
![]() |
|
Yogyakarta, Jum'at, 24 Februari 2023
Djoko Luknanto: Bagaimana prinsip kerja AI?
ChatGPT: Prinsip kerja AI (Artificial Intelligence) didasarkan pada kemampuan komputer untuk mempelajari pola dan informasi dari data, dan kemudian menggunakannya untuk membuat keputusan atau prediksi. Ada beberapa jenis AI, namun yang paling umum digunakan saat ini adalah machine learning dan deep learning.
Machine learning adalah teknik AI yang mengajarkan mesin untuk belajar dari data, dan kemudian membuat prediksi atau keputusan berdasarkan pola yang ditemukan dalam data. Ada tiga jenis utama dari machine learning: supervised learning, unsupervised learning, dan reinforcement learning.
Supervised learning mengajarkan mesin untuk memprediksi output yang benar dari data input yang diberikan. Data input dan output diberikan kepada mesin selama proses pelatihan. Dalam unsupervised learning, mesin belajar dari data tanpa label, dan mencari pola atau struktur dalam data tersebut. Sedangkan dalam reinforcement learning, mesin belajar melalui interaksi dengan lingkungan, di mana mesin menerima penguatan atau hukuman sebagai umpan balik atas keputusan yang dibuat.
Deep learning adalah jenis machine learning yang menggunakan jaringan saraf tiruan untuk memproses informasi. Jaringan saraf tiruan terdiri dari banyak lapisan yang saling terhubung dan memungkinkan mesin untuk memproses informasi secara hierarkis dan mendalam. Deep learning digunakan dalam banyak aplikasi AI yang kompleks, seperti pengenalan wajah, bahasa alami, dan pengenalan suara.
Secara umum, prinsip kerja AI melibatkan pengumpulan data, pelatihan mesin untuk memahami pola dan informasi dari data tersebut, dan kemudian menggunakannya untuk membuat keputusan atau prediksi. Namun, dalam praktiknya, AI melibatkan banyak tahapan dan algoritma yang kompleks dan sangat tergantung pada sumber data yang akurat dan berkualitas.
Ya, beberapa pakar AI membagi AI menjadi dua jenis utama, yaitu AI simbolik dan AI jaringan syaraf (neural network).
AI simbolik, juga dikenal sebagai AI berbasis pengetahuan, menggunakan aturan dan representasi simbolik dalam pengambilan keputusan. AI simbolik berfokus pada pengembangan model pengetahuan yang terdiri dari aturan logis, fakta, dan hubungan antar konsep, yang digunakan untuk memecahkan masalah dan membuat keputusan. Contoh aplikasi AI simbolik adalah sistem pakar, yang dapat memberikan saran atau diagnosis berdasarkan pengetahuan yang diperoleh dari ahli manusia dalam suatu bidang.
Sementara itu, AI jaringan syaraf (neural network) adalah jenis AI yang terinspirasi dari struktur dan fungsi otak manusia. Jaringan syaraf terdiri dari banyak "neuron" atau unit pemrosesan informasi yang terhubung dalam berbagai lapisan. Neural network menggunakan algoritma pembelajaran mesin untuk melatih jaringan untuk memahami pola yang terkait dengan tugas tertentu, seperti pengenalan wajah, bahasa alami, dan pengenalan suara.
Kedua jenis AI ini memiliki kelebihan dan kekurangan masing-masing, dan digunakan dalam berbagai aplikasi yang berbeda. AI simbolik lebih cocok untuk tugas-tugas yang memerlukan pengetahuan khusus dalam suatu domain, sedangkan AI jaringan syaraf lebih cocok untuk tugas-tugas yang memerlukan pemrosesan informasi yang kompleks dan adaptasi yang cepat terhadap perubahan. Kedua jenis AI ini juga dapat digabungkan untuk menghasilkan sistem AI yang lebih canggih dan efektif.
Big data adalah istilah yang digunakan untuk menggambarkan kumpulan data yang sangat besar, kompleks, dan beragam, yang sulit atau bahkan tidak mungkin untuk dikelola dengan menggunakan alat dan teknologi tradisional. Ada beberapa karakteristik yang biasanya digunakan untuk mendefinisikan big data, yaitu:
Dengan karakteristik-karakteristik tersebut, big data menjadi tantangan tersendiri dalam pengelolaan, penyimpanan, pemrosesan, dan analisis data. Namun, big data juga menawarkan potensi besar dalam mendukung pengambilan keputusan yang lebih akurat dan efektif dalam berbagai bidang, seperti bisnis, pemerintahan, kesehatan, dan lain-lain.
Big data dan AI (Artificial Intelligence) adalah dua bidang teknologi yang saling terkait dan saling mempengaruhi. Big data menyediakan sumber daya besar untuk pengembangan AI, sementara AI memungkinkan analisis dan pemrosesan data yang lebih canggih dan efektif dalam big data.
Berikut adalah beberapa korelasi antara big data dan AI:
Korelasi antara big data dan AI membuka potensi besar dalam berbagai bidang, termasuk bisnis, kesehatan, pemerintahan, dan lain-lain. Kombinasi keduanya dapat membantu pengambilan keputusan yang lebih akurat dan lebih efektif, serta mempercepat inovasi teknologi di masa depan.
Sebagai sebuah sistem AI yang menggunakan teknologi pembelajaran mesin (machine learning) dan pemrosesan bahasa alami (natural language processing), ChatGPT termasuk dalam kategori jaringan syaraf (neural networks) dalam AI. Jaringan syaraf merupakan salah satu jenis algoritma pembelajaran mesin yang mirip dengan cara kerja otak manusia dan dapat digunakan untuk melakukan berbagai tugas, seperti klasifikasi data, prediksi, pengenalan pola, dan lain-lain.
Pada dasarnya, ChatGPT terdiri dari jaringan syaraf yang telah dilatih pada jumlah data yang sangat besar (big data) untuk memahami dan menghasilkan bahasa alami manusia dengan lebih baik. Dengan demikian, ChatGPT dapat memproses permintaan pengguna dan memberikan jawaban yang relevan dan dapat dimengerti dalam bahasa manusia.
Meskipun ChatGPT termasuk dalam kategori jaringan syaraf, teknologi ini juga dapat digabungkan dengan teknologi simbolik dalam AI untuk meningkatkan kemampuan ChatGPT dalam memahami konteks dan memperoleh pengetahuan lebih lanjut.
Seiring dengan kemajuan teknologi AI, beberapa institusi dan ahli teknologi mengungkapkan kekhawatiran terkait penggunaan ChatGPT dan teknologi AI lainnya. Beberapa kekhawatiran tersebut antara lain:
Oleh karena itu, penggunaan ChatGPT dan teknologi AI lainnya memerlukan pengawasan dan tanggung jawab yang ketat dari pemerintah, perusahaan, dan masyarakat. Hal ini akan membantu memastikan bahwa teknologi AI digunakan dengan cara yang aman, bertanggung jawab, dan bermanfaat bagi masyarakat secara keseluruhan.
Dalam konteks institusi pendidikan, penggunaan ChatGPT dan teknologi AI lainnya dapat memberikan beberapa manfaat dan tantangan yang perlu diperhatikan. Berikut adalah beberapa contoh:
Manfaat:
Tantangan:
Oleh karena itu, institusi pendidikan perlu mempertimbangkan secara cermat manfaat dan tantangan penggunaan ChatGPT dan teknologi AI lainnya, serta mengembangkan kebijakan dan strategi yang tepat untuk memaksimalkan manfaat teknologi sambil meminimalkan risiko dan tantangan yang mungkin timbul.
Ya, sekarang ini memang banyak orang yang berusaha membuat aplikasi atau metode untuk mendeteksi apakah sebuah karya (biasanya tulisan atau teks) merupakan hasil dari ChatGPT atau tidak. Hal ini dilakukan karena kekhawatiran tentang potensi penyalahgunaan teknologi AI, termasuk ChatGPT, dalam membuat konten palsu atau manipulatif.
Salah satu metode yang umum digunakan adalah dengan memeriksa beberapa karakteristik khas yang dimiliki oleh teks yang dihasilkan oleh ChatGPT, seperti kecenderungan untuk menggunakan kata-kata atau frasa yang tidak biasa, penggunaan kalimat yang sangat panjang atau rumit, atau kurangnya konsistensi atau kesesuaian antara topik dan gaya penulisan. Namun, metode ini masih dalam tahap pengembangan dan belum sepenuhnya dapat diandalkan.
Penting untuk diingat bahwa meskipun teknologi AI dapat digunakan untuk menghasilkan konten yang terlihat otentik, tetapi teknologi ini juga dapat digunakan untuk mengidentifikasi dan mengatasi konten yang palsu atau manipulatif. Oleh karena itu, penting bagi masyarakat untuk terus waspada terhadap potensi penyalahgunaan teknologi AI, sambil terus mempromosikan etika dan penggunaan teknologi yang bertanggung jawab dan bermanfaat.
Bangkitan teks yang berasal dari AI, termasuk ChatGPT, memiliki beberapa karakteristik khas yang membedakannya dari teks yang dihasilkan oleh manusia. Beberapa karakteristik ini antara lain:
Meskipun AI memiliki beberapa karakteristik khas dalam menghasilkan teks, namun teknologi ini terus berkembang dan semakin canggih sehingga dapat menghasilkan teks yang semakin otentik dan menyerupai teks manusia. Oleh karena itu, penting bagi masyarakat untuk terus meningkatkan kesadaran dan keahlian dalam menggunakan teknologi AI dengan bijak dan bertanggung jawab.
Proses paling awal ChatGPT menjawab pertanyaan adalah dengan memanfaatkan model bahasa yang telah dipelajari dari data latihannya. ChatGPT menghasilkan jawaban berdasarkan pemahaman dan analisis terhadap pertanyaan yang diberikan, dengan mencari pola dan korelasi yang ada dalam data latihannya.
Proses yang dilakukan oleh ChatGPT dalam menjawab pertanyaan melibatkan beberapa tahapan, antara lain:
Proses-proses di atas dilakukan secara otomatis oleh ChatGPT dengan menggunakan algoritma dan teknik deep learning yang canggih. Meskipun demikian, jawaban yang dihasilkan oleh ChatGPT masih memiliki kekurangan dan kelemahan, terutama dalam hal pemahaman konteks dan analisis yang mendalam. Oleh karena itu, penting bagi pengguna ChatGPT untuk tetap memeriksa dan mengevaluasi jawaban yang diberikan secara kritis dan cermat.
Setelah ChatGPT mendapatkan jawaban yang tepat untuk sebuah permasalahan, proses selanjutnya adalah menghasilkan kalimat yang tepat dan sesuai dengan konteks pertanyaan yang diberikan. Untuk melakukan hal ini, ChatGPT menggunakan teknik yang disebut dengan Natural Language Generation (NLG).
NLG adalah teknik yang digunakan untuk menghasilkan teks atau kalimat yang sama-sama bisa dipahami oleh manusia dan mesin. Dalam hal ini, ChatGPT menggunakan model bahasa yang telah dilatih sebelumnya untuk menghasilkan teks atau kalimat yang benar secara gramatikal dan kontekstual.
Proses pembentukan kalimat oleh ChatGPT dilakukan secara iteratif, yaitu kata demi kata. Pada setiap iterasi, ChatGPT mengambil kata atau frasa dari jawaban yang telah ditemukan sebelumnya, dan membangun kalimat yang lebih panjang dan lengkap dengan memperhatikan tata bahasa dan konteks yang sesuai.
Proses ini melibatkan penggunaan aturan-aturan tata bahasa dan semantik yang telah dipelajari oleh model bahasa ChatGPT selama proses pelatihan, serta pemilihan kata dan frasa yang tepat untuk menghasilkan kalimat yang tepat dan mudah dipahami.
Setelah proses pembentukan kalimat selesai dilakukan, ChatGPT akan menyajikan kalimat tersebut kepada pengguna dalam bentuk teks atau suara, tergantung pada jenis interaksi yang dilakukan oleh pengguna dengan sistem.
Transliterasi, yaitu mengubah tulisan dalam satu bahasa ke dalam bentuk tulisan yang sama dalam bahasa lain, adalah tugas yang cukup kompleks bagi sebuah AI berbasis teks, terutama jika bahasa yang dituju memiliki perbedaan yang signifikan dalam tata bahasa, ejaan, atau struktur kalimat.
Pada dasarnya, transliterasi membutuhkan pemahaman yang mendalam tentang aturan tata bahasa dan ejaan bahasa sumber dan bahasa tujuan, serta kemampuan untuk mengekstrak dan mengubah informasi dari teks dalam bahasa sumber ke dalam teks dalam bahasa tujuan.
Meskipun begitu, terdapat teknik-teknik dan algoritma yang dapat digunakan untuk membantu AI berbasis teks dalam melakukan transliterasi. Salah satu teknik yang umum digunakan adalah menggunakan kamus atau tabel konversi yang memetakan setiap karakter atau kata dalam bahasa sumber ke karakter atau kata yang sesuai dalam bahasa tujuan. Selain itu, teknik pembelajaran mesin seperti pembelajaran berbasis aturan atau pembelajaran berbasis data juga dapat digunakan untuk meningkatkan kualitas transliterasi.
Namun, meskipun AI berbasis teks dapat digunakan untuk melakukan transliterasi, kualitas transliterasi yang dihasilkan belum tentu selalu akurat. Hal ini tergantung pada seberapa baik sistem telah dilatih dan pada kualitas sumber data yang digunakan untuk pelatihan. Oleh karena itu, tetap diperlukan pengawasan dan evaluasi manusia untuk memastikan kualitas transliterasi yang baik.
Berikut adalah beberapa tahapan transliterasi dari satu bahasa ke bahasa lain:
Tahapan transliterasi dapat berbeda-beda tergantung pada teknik dan algoritma yang digunakan oleh AI dan kompleksitas bahasa sumber dan bahasa tujuan.
ChatGPT adalah sebuah model AI berbasis bahasa Inggris yang dilatih pada korpus bahasa Inggris yang sangat besar. Meskipun model ini dapat digunakan untuk memahami dan menghasilkan teks dalam berbagai bahasa, kemampuan ChatGPT dalam menguasai bahasa-bahasa tertentu tergantung pada data pelatihan yang tersedia dalam bahasa tersebut. Saat ini, terdapat beberapa versi ChatGPT yang dilatih pada korpus bahasa tertentu seperti bahasa Tionghoa, Jerman, dan Prancis, namun kemampuan model ini dalam menguasai bahasa lainnya masih terbatas dan memerlukan data pelatihan yang cukup besar dalam bahasa tersebut. Oleh karena itu, tidak ada jumlah pasti bahasa di Bumi yang sudah dikuasai oleh ChatGPT karena kemampuan model ini terus berkembang seiring dengan penambahan data pelatihan dalam bahasa-bahasa baru.
Ya, ChatGPT dapat memproses bahasa dengan aksara yang bukan Latin, meskipun kemampuan ChatGPT dalam memproses bahasa tersebut tergantung pada jumlah dan kualitas data pelatihan yang tersedia dalam bahasa tersebut. Untuk bahasa yang menggunakan aksara non-Latin, misalnya bahasa Tionghoa, Jepang, Korea, atau Arab, ChatGPT perlu dilatih dengan dataset yang menggunakan aksara tersebut agar dapat memahami dan menghasilkan teks dalam bahasa tersebut. Salah satu tantangan dalam pelatihan model AI untuk bahasa non-Latin adalah kesulitan dalam representasi karakter dan struktur bahasa yang berbeda-beda, namun teknologi pembelajaran mesin saat ini telah memungkinkan pelatihan model AI untuk memproses bahasa-bahasa dengan aksara yang bukan Latin.
Sebagai model AI berbasis bahasa Inggris, ChatGPT sebenarnya tidak secara otomatis dapat memahami aksara Arab atau bahasa-bahasa non-Latin lainnya. Namun, jika telah dilakukan pelatihan model pada data bahasa Arab, misalnya dengan menggunakan dataset teks dalam aksara Arab yang besar, kemudian model diuji coba dengan beberapa contoh teks dalam bahasa Arab, maka kemungkinan model dapat memahami dan memberikan respons yang sesuai. Oleh karena itu, ChatGPT dapat dipelajari dan dikembangkan untuk memproses bahasa Arab dan bahasa non-Latin lainnya, namun memerlukan data pelatihan dalam bahasa tersebut untuk mencapai performa yang baik.
ChatGPT sebagai model AI berbasis bahasa Inggris, secara default tidak memiliki kemampuan untuk menulis menggunakan aksara Arab atau bahasa-bahasa non-Latin lainnya. Namun, model ini dapat dilatih dan dikembangkan pada dataset bahasa Arab agar dapat memahami dan menghasilkan teks dalam bahasa tersebut.
Saat ini, terdapat beberapa proyek penelitian yang berfokus pada pengembangan model AI untuk bahasa Arab menggunakan teknologi seperti ChatGPT. Beberapa model AI berbasis bahasa Arab yang telah dikembangkan menggunakan pendekatan generatif seperti ChatGPT, namun kemampuan dan kualitas model masih terus ditingkatkan melalui pengumpulan data pelatihan dan pengembangan teknik-teknik pembelajaran mesin yang lebih baik. Oleh karena itu, meskipun kemampuan ChatGPT dalam menulis menggunakan aksara Arab masih terbatas, kemungkinan besar model ini akan terus berkembang dan dapat diadaptasi pada bahasa-bahasa non-Latin lainnya di masa depan.
Perplexity dan bursting adalah istilah yang digunakan dalam konteks evaluasi kualitas generasi kalimat oleh model AI seperti ChatGPT.
Perplexity adalah ukuran yang digunakan untuk mengukur seberapa baik model dapat memprediksi kata selanjutnya dalam urutan kata yang diberikan. Semakin rendah nilai perplexity, semakin baik kemampuan model untuk memprediksi kata berikutnya dalam urutan kata. Sebaliknya, semakin tinggi nilai perplexity, semakin buruk kemampuan model untuk memprediksi kata selanjutnya.
Bursting, di sisi lain, adalah fenomena ketika model AI seperti ChatGPT menghasilkan beberapa kata yang sangat relevan dengan topik tertentu secara tiba-tiba, namun kemudian mengalami penurunan kualitas atau ketepatan yang signifikan pada kata-kata selanjutnya. Fenomena ini dapat terjadi karena adanya gangguan dalam representasi topik, kehilangan fokus, atau masalah lainnya pada pembangkitan kalimat oleh model AI.
Perplexity dan bursting adalah dua hal yang saling berkaitan dalam evaluasi kualitas pembangkitan kalimat oleh model AI seperti ChatGPT. Meskipun model AI seperti ChatGPT dapat menghasilkan kalimat yang gramatikal dan wajar secara semantis, tetapi jika nilai perplexity tinggi atau terjadi fenomena bursting, maka kalimat yang dihasilkan mungkin tidak sesuai dengan konteks atau tujuan yang diinginkan. Oleh karena itu, penting untuk memperhatikan kedua hal ini saat mengevaluasi kualitas pembangkitan kalimat oleh model AI.
Perplexity dan bursting dihitung sebagai metrik evaluasi kualitas pembangkitan kalimat oleh model AI seperti ChatGPT.
Perplexity dihitung berdasarkan probabilitas model dalam memprediksi kata selanjutnya dalam urutan kata yang diberikan. Semakin rendah nilai perplexity, semakin baik kemampuan model untuk memprediksi kata berikutnya dalam urutan kata. Perplexity dihitung dengan rumus sebagai berikut:
Perplexity = exp(-1 * log likelihood / total number of words)
Di sini, log likelihood adalah logaritma natural dari probabilitas model dalam memprediksi kata selanjutnya, dan total number of words adalah jumlah total kata dalam data uji.
Sementara itu, bursting dihitung dengan menggunakan dua metrik kualitas pembangkitan kalimat oleh model AI: informativeness dan consistency. Informativeness mengukur seberapa informatif kalimat yang dihasilkan oleh model AI, sedangkan consistency mengukur seberapa konsisten kalimat yang dihasilkan dengan topik yang diberikan.
Bursting terjadi ketika model AI menghasilkan beberapa kata yang sangat relevan dengan topik tertentu secara tiba-tiba, namun kemudian mengalami penurunan kualitas atau ketepatan yang signifikan pada kata-kata selanjutnya. Untuk menghitung bursting, perlu dilakukan pengukuran terhadap nilai informativeness dan consistency dari beberapa kalimat yang dihasilkan oleh model AI. Salah satu metode yang umum digunakan untuk mengukur bursting adalah melalui human evaluation, di mana manusia diberikan tugas untuk menilai kualitas kalimat yang dihasilkan oleh model AI.