Apakah tulisan AI dapat dilacak?

7 bulan yang lalu 26 tontonan

Ya, tulisan AI boleh dikesan, tetapi alat pengesan sedia ada sering tidak tepat. Terbukti, alat ini pernah tersilap melabel dokumen tulisan manusia seperti Perlembagaan AS sebagai janaan AI. Ini menunjukkan keupayaan mengesan teks buatan AI masih belum sempurna dan boleh dipersoalkan.

Maklum Balas 0 suka

Anda mungkin ingin bertanya?Lebih banyak

Bagaimana cara mengesan atau melacak tulisan yang dihasilkan AI?

Hmm, pasal nak kesan tulisan AI ni, bukan senang nak kata la. Dulu masa awal-awal dengar pasal alat detect AI, aku macam terkejut juga. Katanya sampai dokumen macam Perlembagaan Amerika pun boleh tersilap kena cop AI. Pelik kan? Macam mana boleh jadi macam tu?

Lepas tu aku cuba cari info lebih lanjut, baca sikit kat East Central College punya laman web tu. Ada disebut pasal benda apa yang kena perhatikan kalau nak detect teks AI ni. Tapi jujurnya, bukan benda yang mudah nak dihafal semua. Kadang macam pening kepala sikit nak faham semua terma teknikal dia tu.

Apa yang aku perhatikan sendiri, gaya penulisan AI ni kadang nampak terlalu 'sempurna'. Tak ada langsung rasa spontan atau kelucuan macam kita cakap-cakap biasa. Kadang ayatnya terlalu teratur, terlalu 'betul', sampai rasa macam tak realistik. Ia macam robot yang cuba jadi manusia, tapi masih nampak sisa-sisa robotnya tu.

Aku pernah terjumpa satu artikel kat internet, tak ingat dah kat mana, tapi dia cerita pasal ada pensyarah yang gunakan AI untuk buat kerja universiti dia. Dia share benda yang AI hasilkan tu macam mana, pastu dia cerita macam mana dia rasa 'kosong' bila baca, macam tak ada jiwa. Benda tu betul-betul buat aku terfikir.

Jadi, kalau nak kesan tu, kena tengok betul-betul dari segi rasa. Adakah tulisan tu ada emosi? Ada pandangan peribadi yang unik? Atau ia sekadar himpunan maklumat yang tersusun rapi tapi tanpa 'nyawa'? Macam masa aku baca satu laporan pasal kajian terbaru tentang perubahan cuaca, data dia lengkap tapi cara penyampaian dia terlalu formal, aku rasa macam membaca buku teks, bukan pandangan orang yang betul-betul terlibat.

Bukan apa, kadang benda tu macam subjektif sikit. Tapi dengan makin banyak AI ni keluar, mungkin lepas ni akan ada cara yang lebih canggih lagi untuk kenal pasti. Buat masa ni, kena guna mata hati dan pemerhatian yang lebih teliti lah. Jangan cepat percaya sangat dengan apa yang nampak 'sempurna' sangat. Kadang yang tak sempurna itulah yang buat ia jadi tulisan manusia sebenar.

Bagaimana tulisan yang dihasilkan AI terdeteksi?

Ia kenal corak. Macam mana manusia tulis, ada senget, ada rapat. AI tak buat macam tu. Dia kemas. Senyap-senyap dia belajar.

Ia cari kelainan. Manusia lupa hurup, typo. AI? Terlalu sempurna, kadang. Atau terlalu tak sempurna di tempat yang salah. Tergantung pada latihannya.

Senarai tak jadi tak apa. Asalkan isinya.

Algoritme ML. Itu je namanya. Latih dia dengan banyak teks. Teks manusia. Teks mesin. Dia tangkap beza.
Pola. Setiap penulis ada jejak. AI pun ada. Cuma jejak AI ni, kalau nampak, senang detect. Seperti tanda tangan terlampau seragam.
Teks yang besar. Tak cukup sikit-sikit. Kena beribu. Berjuta. Baru dia nampak beza halus.

Kadang, nak cari beza dia macam cari jarum dalam jerami. Tapi jarum tu, ada kilat lain sikit.

Keluaran AI ini boleh dikesan melalui:

Kekemasan dan keseragaman yang luar biasa. AI cenderung menghasilkan teks yang terlalu rapi, tanpa kesilapan ejaan atau tatabahasa yang lazim dalam penulisan manusia.
Pola berulang atau susunan ayat yang boleh diramal. Walaupun AI boleh menghasilkan pelbagai gaya, sesetengah model mungkin menunjukkan corak tertentu dalam pembentukan ayat atau pilihan perkataan yang boleh dikenal pasti.
Penggunaan perbendaharaan kata yang luas tetapi kurang kedalaman emosi atau pengalaman peribadi. AI mungkin menggunakan perkataan yang canggih tetapi tidak dapat menyampaikan nuansa atau sentimen seperti manusia.
Kurang terhadap idiomatik atau bahasa percakapan yang spontan. Penulisan manusia sering kali diselitkan dengan frasa harian atau ungkapan yang unik, yang mungkin kurang dalam teks AI.
Ketidakselarasan nada atau gaya dalam teks yang panjang. Kadang-kala, bahagian-bahagian yang dihasilkan AI mungkin kelihatan seperti datang dari sumber yang berbeza kerana AI mungkin tidak mengekalkan konsistensi nada secara menyeluruh.
Keupayaan AI untuk meniru pelbagai gaya penulisan. Ini juga boleh menjadi petunjuk. Jika teks bertukar gaya secara drastik dalam satu perenggan, ia boleh jadi tanda AI.

Makna tersirat itu, ia datang dari pemerhatian. Macam mana kita tahu siapa kita? Dari apa yang kita buat, bukan apa yang kita cakap. AI pun sama, dari apa yang ia hasilkan.

Apa yang membuat teks AI terdeteksi?

Entah kenapa, tulisan AI ni nampak macam robot, eh? Macam takde jiwa je. Ada benda ni, macam laju sangat dia taip, takde jeda macam kita ni. Pastu, ayat dia pun macam sama je aje memanjang. Macam dah kena simpan dalam 'database' dia je. Takde spontan langsung.

Dia guna nama NLP dengan ML ni kan? Sama je dengan alat nak kesan tulisan AI ni. Macam berlawan la pulanya. Tapi kalau dah tau benda tu AI buat, senang je kan nak kesan dia punya gaya. Kan?

Maklumat.

Kepelbagaian ayat: Teks AI cenderung guna ayat yang lebih ringkas dan susunan sama. Manusia pula campur aduk.
Kebarangkalian perkataan: AI suka guna perkataan yang 'pasti' akan muncul berdasarkan data dia. Kurang kejutan.
Corak penulisan: Gaya yang sama, ritma yang konsisten, macam takde emosi.
Penggunaan frasa: Ada frasa tertentu yang AI kerap pakai.
Kesalahan yang tak dijangka: Manusia buat silap 'betul', AI buat silap ikut corak data.

Bagaimana Turnitin mendeteksi tulisan AI?

Okay, Turnitin kan. Aduh, nak hantar assignment ni. Risau gila kalau kena AI. Macam mana dia tau eh? Dia scan macam mana? Turnitin ni potong-potong teks jadi cebisan kecil, ayat-ayat pendek. Hmm, bukan baca sebuku ke? Dia pecahkan dulu.

Lepas tu, potongan-potongan tu dia tindih-tindihkan pula. Kenapa tindih? Dia tindih-tindihkan potongan teks tu, mungkin nak tengok konteks penuh. Yelah, kalau ayat berdiri sendiri lain, bila ada ayat sebelum dan selepas, makna dia boleh berubah kan. Aku rasa macam tu lah.

Lepas dah potong, dah tindih, baru dia jalan kan dekat penunjuk AI dia. Penunjuk AI? Maksudnya ada macam checklist ke apa? Macam mana dia beza AI dengan tak AI. Aku sendiri pun kadang menulis sampai rasa macam robot. Fuh, pening kepala. Betul ke dia detect ni? Kalau aku edit sikit-sikit? Ada ke orang pakai AI ni? Mesti ramai.

Dia ada sistem dia, macam nak kenal pasti tanda-tanda spesifik tulisan AI. Entah apa yang dia cari tu. Consistency? Grammar terlalu sempurna? Predictability? Pelik.

Tambahan:

Bagaimana Turnitin Mengenali Tulisan AI:
- Analisis Kebarangkalian Kata: Mengukur kebarangkalian perkataan berikut dalam jujukan, AI cenderung memilih perkataan yang paling 'logik' dan kerap.
- Perplexity (Kerumitan): Menilai kerumitan dan variasi ayat. Tulisan manusia biasanya lebih bervariasi dan kurang dapat diramal.
- Burstiness (Kepadatan): Mengukur variasi panjang ayat. Penulisan AI cenderung mempunyai panjang ayat yang lebih konsisten.
- Pola Tatabahasa dan Struktur: Mengenal pasti pola tatabahasa yang terlalu sempurna atau berulang-ulang, yang lazim dalam penulisan AI.
- Perbandingan dengan Data Latihan AI: Membandingkan gaya tulisan dengan set data besar yang diketahui dihasilkan oleh model AI.
Ketepatan Deteksi AI Turnitin:
- Bukan 100% tepat: Hasil deteksi adalah indikasi kebarangkalian, bukan jaminan mutlak.
- Potensi Positif Palsu: Kadangkala, tulisan manusia yang sangat formal atau berstruktur boleh disalah anggap sebagai tulisan AI.
- Potensi Negatif Palsu: Tulisan AI yang disunting dengan meluas oleh manusia mungkin tidak dapat dikesan.
- Fokus pada Model Generatif: Khusus mengesan teks yang dihasilkan oleh model bahasa besar (LLM) seperti GPT-3, GPT-4.
Skor Deteksi:
- Peratusan Kebarangkalian: Menunjukkan peratusan teks yang berkemungkinan besar dihasilkan oleh AI.
- Memerlukan Penelitian Manusia: Skor tinggi memerlukan pensyarah atau pemeriksa untuk menyiasat lebih lanjut secara manual.

Bagaimana universitas mendeteksi teks yang dihasilkan AI?

Takde maknanya nak detek AI ni macam nak korek biji durian dalam gelap. Dulu ingat macam takde apa, sekali rupanya alat macam Turnitin ni dah pandai menyamar jadi detektif, siap boleh kenal pasti mana satu kerja budak pandai buat guna robot dengan ketepatan tahap kilat menyambar pokok kelapa.

Nak harapkan budak-budak ni jujur tu macam suruh naga beranak pinak, memang tak la. Ni semua sebab takut kena cancel peperiksaan kut. Jadi, alat ni jadi macam mata ketiga pengetua yang garang tu, memang sah sah boleh detect kalau ada unsur-uns AI dalam esei korang.

Maklumat Tambahan:

Jenis Alat: Perisian anti-plagiarisme.
Fungsi Utama: Mengesan teks yang dihasilkan oleh kecerdasan buatan (AI).
Tahap Keberkesanan: Hampir sempurna dalam mendeteksi peniruan AI.

Bisakah Google mengetahui apakah konten ditulis oleh AI?

Google... dia tahu ke tak sebenarnya, kalau apa yang kita tulis ni datang dari AI? Soalan ni... kadang-kadang berlegar. Dia punya algoritma tu, memang dilatih dengan data yang sangat, sangat besar. Jadi, bila AI tu menulis, dia akan keluarkan teks yang macam... serupa sangat dengan data-data yang dia dah telan tu. Macam tu lah dia berfungsi.

Dan Google... dia ada cara dia sendiri. Guna algoritma pembelajaran mesin jugak. Macam mana dia tengok? Dia scan, dia cari isyarat-isyarat tertentu. Macam... struktur ayat, cara kita guna tata bahasa, sintaksis dalam penulisan tu. Kadang, ada pola yang... nampak sangat ‘sempurna’, tak macam orang biasa menulis. Itu yang buat dia syak, agaknya.

Nak elak dari dikesan ni... ramai yang cuba. Terutamanya bab SEO. Ada je cara-cara orang cuba untuk mengaburi mata Google. Tapi entahlah... sampai bila boleh bertahan. Semua orang nak jadi asli, tapi terpaksa akur dengan keadaan, kan.

Maklumat Tambahan Mengenai Pengesanan Kandungan AI Oleh Google:

Pendirian Rasmi Google
- Google tidak melarang penggunaan AI untuk menjana kandungan.
- Fokus utama Google ialah kualiti dan manfaat kandungan kepada pengguna, bukan cara ia dihasilkan.
- Kandungan yang dijana AI perlu bermanfaat, asli, dan berkualiti tinggi untuk mendapat ranking baik dalam enjin carian.
Mekanisme Pengesanan AI
- Perplexity dan Burstiness: Algoritma AI Google menganalisis "perplexity" (kerumitan atau keunikan ayat) dan "burstiness" (variasi panjang ayat dan struktur). Kandungan AI selalunya mempunyai perplexity rendah dan burstiness kurang.
- Pola Tatabahasa dan Sintaksis: AI cenderung menghasilkan tatabahasa yang sangat tepat dan struktur ayat yang seragam, berbeza dengan penulisan manusia yang lebih fleksibel dan bervariasi.
- Konsistensi Nada dan Gaya: Kandungan AI mungkin menunjukkan konsistensi nada dan gaya yang terlalu ketat, tanpa perubahan kecil atau "ketidaksempurnaan" yang biasa terdapat dalam penulisan manusia.
- Pola Berulang: AI boleh menghasilkan frasa atau struktur ayat yang berulang secara tidak sengaja, isyarat yang boleh dikesan.
Strategi untuk Mengurangkan Pengesanan (dan Meningkatkan Kualiti)
- Penyuntingan dan Sentuhan Manusia: Sentiasa semak dan ubah suai kandungan yang dihasilkan AI dengan penulisan dan pemikiran manusia untuk menjadikannya lebih asli.
- Penambahan Perspektif Asli: Selitkan pandangan peribadi, contoh unik, atau cerita yang hanya boleh datang daripada pengalaman manusia.
- Diversiti Struktur Ayat: Ubah kepelbagaian panjang dan struktur ayat untuk menjadikannya lebih semula jadi dan kurang dapat diramal.
- Fokus pada Nilai Tambah: Pastikan kandungan memberikan nilai sebenar, maklumat baru, atau perspektif unik yang tidak mudah dijana secara automatik.

Apakah AI detector akurat?

Pengesan AI ni macam pak guard kat pusat beli-belah yang terlebih rajin. Dia tengok ayat kau tersusun kemas macam budak sekolah nak ambil anugerah, terus dia syak kau guna AI. Padahal, ada je manusia yang memang tulis skema macam tu, contohnya bekas cikgu Bahasa Melayu aku dulu, Cikgu Zaiton, tulisan dia lagi robotik dari robot.

Dia bukan faham apa yang kau tulis pun. Dia cuma 'cam' corak. Macam kita cam corak baju raya tiap tahun, haa macam tu la. Kalau ayat kau banyak guna perkataan 'justeru', 'oleh itu', 'maka', dan ayat pasif yang berbelit-belit, loceng amaran dia akan berbunyi KRIINGGG! Sebab AI suka betul guna ayat-ayat formal yang manusia normal dah lama tak pakai masa borak kat kedai mamak.

Ketepatan pengesan AI (AI detector) adalah rendah. Ia berfungsi dengan menganalisis corak teks menggunakan pemprosesan bahasa semula jadi (NLP) dan pembelajaran mesin, mencari tanda-tanda yang sering dikaitkan dengan tulisan AI. Rendah tu maksudnya, kalau baling dadu pun lagi tinggi peluang nak betul. Dia boleh tuduh penulisan Hemingway sebagai hasil AI sebab ayatnya ringkas, dan pada masa sama, dia lepas pula karangan AI yang sengaja dibuat berterabur. Ia umpama polis trafik yang saman orang bawak Kancil sebab laju, tapi bagi laluan kat Ferrari.

Kenapa dia selalu salah teka? Macam teka nombor ekor la, banyak tak kena dari yang kena.

Manusia pun macam robot: Ada orang yang cara penulisannya memang sangat formal dan tersusun. Terus kena cop AI. Kesian Cikgu Zaiton aku tu.
AI pandai menyamar: AI model terkini macam GPT-4 ke atas dah diajar untuk menulis macam manusia, siap ada salah eja sikit-sikit. Pengesan AI tu terus pening lalat, tak tahu nak syak siapa.
Tak faham konteks & slanga: Cuba bagi dia baca status Facebook makcik-makcik atau budak-budak Wechat. Terus error 404. Dia tak faham bahasa rojak, ayat tergantung, atau sindiran kita yang berbisa tu.
Perlumbaan yang tak adil: Pembangun AI berlari macam Usain Bolt, pembangun pengesan AI pulak jalan itik terkedek-kedek kat belakang. AI sentiasa selangkah di hadapan.

Bisakah AI mendeteksi AI lainnya?

Betul juga. AI ni macam budak pandai dalam kelas. Guru (detektor AI) boleh nampak kalau jawapan tu datang dari budak yang sama, sebab ada gaya penulisan yang serupa. Kalau AI diminta tulis macam budak genius, tentulah susah nak beza. Tapi kalau dia tulis macam budak tak berapa nak pandai, terdedahlah dia. Takkan AI pun nak acah 'average' pulak kan? Tu yang detektor tu cuba korek 'kebingungan' atau corak unik yang ada dalam 'jiwa' AI.

Detektor AI ni sebenarnya taklah hebat sangat pun. Dia cuma macam peguam yang cuba cari bukti. Dia tengok 'tabiat' ayat AI, macam mana dia susun perkataan, macam mana dia 'blur' sikit kat sesetengah tempat. Kalau ayat tu macam terlalu sempurna, macam polis kaji tempat kejadian, memanglah mencurigakan. Macam budak yang hafal jawapan periksa, tahu jawapan tapi tak faham pun maksudnya.

Jadi, boleh ke AI deteksi AI lain? Boleh, tapi takdelah macam detektif Sherlock Holmes. Dia macam cuba teka siapa yang curi kuih kat dapur berdasarkan serbuk tepung yang tertinggal. Kalau AI tu buat 'kesalahan' yang sama berulang kali, barulah detektor tu rasa macam 'aha!'. Tapi AI yang bijak, dia belajar daripada kesilapan, jadi dia boleh tukar corak dia. Macam penjenayah yang tukar modus operandi.

Senarai Perkara yang Detektor AI Cari:

Kebingungan (Perplexity): Macam mana AI tu 'berfikir' masa tulis. AI yang 'terlalu pandai' mungkin kurang kebingungan, macam tak pernah tersilap langkah.
Serapan (Burstiness): Perubahan dalam panjang ayat dan perkataan yang digunakan. Manusia ni macam pelangi, kejap ayat panjang, kejap pendek. AI kadang-kadang 'uniform' sangat.
Corak Tertentu: Susunan perkataan, pilihan frasa yang berulang. Kalau tiap kali cakap pasal 'kebaikan', mesti guna perkataan 'syukur', 'rahmat', memang nampak macam skrip.

Perangkap Deteksi AI:

AI yang Pandai Berlakon: Kalau AI tu dah dilatih untuk jadi 'manusia', memang susah nak kesan. Dia boleh meniru gaya tulisan manusia yang tak sempurna.
Kesilapan Detektor: Kadang-kadang, detektor AI ni terlampau 'overzealous'. Dia tuduh tulisan manusia tu AI padahal tak pun. Macam polis salah tangkap.
AI Baru Muncul: Model AI yang lebih baru kadang-kadang punya corak yang berbeza, jadi detektor lama tak 'kenal' dia.