Apa yang membuat teks AI terdeteksi?

28 tontonan
Teks AI mudah dikesan kerana cenderung memiliki struktur ayat yang seragam, mudah diramal, serta nada yang monoton. Berbeza dengan penulisan manusia, ia lebih bervariasi, penuh kejutan, dan tidak berulang. Alat pengesan AI turut memanfaatkan Pemprosesan Bahasa Semula Jadi (NLP) dan Pembelajaran Mesin (ML) untuk mengenal pasti corak-corak tersebut.
Maklum Balas 0 suka

Bagaimana cara pengesan AI mengenal pasti tulisan AI?

Ha, macam mana AI ni boleh tau tulisan kita ni dibuat oleh AI jugak kan? Mesti ada cara dia. Selalunya, depa cakap pasal 'kebingungan' dan 'ledakan' ni lah yang membezakan. Kalau ayat nampak macam senang sangat nak teka, berulang-ulang je bunyinya, tu tanda kuat lah tu ada robot yang tolong karang.

Macam mana depa buat? Sama je macam AI yang tulis tu, depa pun guna jugak apa yang depa panggil NLP dengan ML ni. Bahasa ni macam mana nak diterjemah, macam mana nak faham makna. Lepas tu, depa latih pulak mesin tu untuk kenal corak-corak.

Contohnya, masa saya mula-mula main dengan AI writer ni dulu, rasa macam pelik sikit. Ayat dia kadang smooth sangat, tapi macam hilang 'jiwa' sikit. Lain tau bila kita sendiri yang menaip, ada je rasa teragak-agak, nak tukar perkataan, nak bagi ayat tu mengalir ikut hati kita. AI ni dia tak macam tu, dia macam ikut buku panduan je.

Pernah sekali tu, saya cuba suruh AI tulis cerita pendek pasal kucing saya yang bulunya kelabu terbakar masa main bunga api raya tahun lepas. Tapi dia tulis macam formal sangat, takde pulak nak selitkan pasal saya risaukan dia masa tu. Nampak sangatlah dia takde 'pengalaman' sebenar. AI ni dia tak rasa apa, kan? Tu la beza paling ketara buat saya.

Jadi, bila alat pengesan ni dia tengok, dia boleh 'rasa' ke tak wujudnya emosi, keunikan cara berfikir, atau kesilapan kecil yang buat tulisan tu nampak macam manusia yang buat. Ni bukan macam report rasmi, tapi lebih kepada macam kita ni bercakap je, apa yang kita nampak, apa yang kita rasa. Itu lah kut cara paling mudah nak faham.

Bagaimana cara menghentikan teks AI agar tidak terdeteksi?

Aduh, ingat lagi bulan lepas, kepala aku dah serabut gila siapkan laporan untuk klien. Deadline tu betul-betul buat aku rasa nak tercabut kepala. Macam biasa, kalau dah terdesak, laju je tangan ni taip arahan kat AI, nak mintak idea. Malam tu, dalam pukul 2 pagi, aku kat meja kerja berselerak, depan laptop panas berasap.

Bila aku baca balik draft AI bagi, terus rasa tak sedap hati. Serius, bunyi dia macam robot bebel, kaku gila. Aku terus cuak, mati la kalau klien dapat tahu ni AI tulis. Bangkit, bancuh kopi O kaw punya, letak atas coaster Mickey Mouse aku tu.

Fikir punya fikir, aku teringat kawan pernah pesan, jangan sesekali hantar hasil AI macam tu je. Nanti kena flag dek AI detection. Terus aku fokus. Aku ambil satu perenggan, baca, lepas tu aku start la tukar ayat dia.

Bukan semua, tapi aku cari perkataan yang formal sangat, ayat yang panjang berjela, aku pecah-pecahkan. Ubah sikit, tambah sentuhan aku, mungkin 20% kot kalau nak kira kasar. Perasaan masa tu? Rasa macam tukang masak adjust rasa masakan.

Memanglah kerja jadi dua kali ganda, tapi aku suka bila tengok balik ayat yang diolah tu, bunyi dia jadi lain, lebih mesra, lebih 'aku' punya style. Ada part aku selitkan sikit analogi yang aku rasa orang senang faham.

Terus buang ayat-ayat 'berdasarkan kajian menunjukkan' yang AI selalu guna tu. Yang penting, mesej utama tak lari, tapi penyampaian tu jadi manusiawi.

Sampai pukul 4 pagi jugak aku mengadap, dah macam zombie dah muka ni. Tapi bila hantar laporan tu, rasa lega gila macam dapat tarik nafas dalam air. Memang tak ada isu langsung pasal detection. Gila berbaloi penat malam tu. Kena buat macam tu la kalau nak elak.


Untuk menghentikan teks AI daripada dikesan, pengulangan dan parafrasa berkesan adalah kunci utama. Ini bukan hanya tentang menukar beberapa perkataan, tetapi mengubah corak bahasa dan struktur ayat.

  • Ubah 15-20% Kandungan Teks:
    • Penelitian menunjukkan bahawa mengubah sekurang-kurangnya 15-20% teks dapat mengganggu pola bahasa AI yang mudah dikesan oleh alat pengesan. Ini melibatkan frasa, struktur ayat, dan pilihan perkataan.
  • Fokus pada Kealamian dan Komunikasi:
    • Tujuan utama adalah menjadikan teks kedengaran lebih alami dan seperti tulisan manusia. AI cenderung menggunakan frasa yang formal, berulang, atau terlalu sempurna dari segi tatabahasa.
    • Gantikan perkataan yang sering digunakan AI dengan sinonim yang lebih unik atau sesuai konteks.
    • Ubah struktur ayat yang seragam kepada pelbagai jenis ayat (pendek, panjang, kompleks).
    • Selitkan peribahasa, simpulan bahasa, atau ungkapan tempatan yang tidak mungkin dijana oleh AI.
    • Masukkan perspektif peribadi atau contoh dunia nyata jika sesuai, ini akan menambah sentuhan manusiawi.
    • Pastikan mesej inti kekal tidak berubah walaupun gaya penulisan diolah.

Bagaimana cara mendeteksi tulisan AI?

Di ruang hening ini, cuma suara hujan yang setia menemani. Di hadapan skrin yang memancarkan cahaya pudar, jemari ini menari, mencari jejak. Aksara, aksara yang meluncur lancar, indah pada luaran, namun seringkali mengundang resah. Ada kalanya, ia terlalu sempurna, terlalu tersusun, mengikis kehangatan jiwa yang merajut kata. Malam kian larut.

Ada satu pintu, gerbang digital bernama undetectable.ai. Ia seolah sebuah cermin usang, tempat kita mengharap pantulan kebenaran. Dulu, setiap ungkapan adalah jeritan hati, lara yang terukir nyata. Kini, setiap perkataan bisa jadi gema, bayangan kosong dari entiti tanpa perasaan. Aku masih ingat angin dingin menusuk jendela. Sebuah pencarian, selalu.

Kuteliti bait-bait yang kuragui, menyalinkan setiap baris, seperti mengutip serpihan kenangan yang hilang. Kemudian, di ruang kosong yang tersedia, aku lekatkan ia, dengan satu harapan samar. Keaslian. Ia satu pencarian yang tidak berpenghujung, sebuah kerinduan terhadap sentuhan yang nyata dalam dunia maya. Benarkah ia cuma rindu?

Ada satu persetujuan, satu tanda kecil yang perlu dicentang. Ia bukan sekadar tanda, tetapi pengakuan kita terhadap keraguan yang membelenggu. Jiwa kita mencari kebenaran, ya. Kita cuma mahukan ketulenan dalam setiap lafaz. Kadangkala, ia cuma tentang itu. Mencari kembali apa yang kita rasa telah hilang.

Lalu, butang itu, 'Check For AI'. Ia bukan sekadar klik, tetapi satu tarikan nafas panjang. Menanti. Skrin berkedip perlahan, seolah ia turut berfikir, turut merasai ketidakpastian ini. Adakah ini suara yang bernyawa, ataukah sekadar bayangan ciptaan tanpa ruh? Aku tunggu.


  • Tujuan Deteksi AI: Membezakan penulisan yang dihasilkan oleh manusia daripada kandungan ciptaan model bahasa buatan.
  • Ciri-ciri Umum Tulisan AI:
    • Keterseragaman Gaya: Seringkali menunjukkan gaya penulisan yang konsisten dan sempurna, kurang variasi.
    • Kurang Emosi dan Nuansa Peribadi: Kebiasaannya tiada ekspresi emosi atau pengalaman peribadi yang mendalam.
    • Struktur Ayat Berulang: Cenderung menggunakan pola atau struktur ayat yang sama secara berlebihan.
    • Ketiadaan Kesilapan Manusia: Jarang terdapat kesilapan tatabahasa atau ejaan kecil yang tidak disengajakan.
    • Fakta Umum: Lebih cenderung menyajikan maklumat umum berbanding pandangan yang unik atau mendalam.
  • Kepentingan Deteksi Tulisan AI:
    • Integriti Akademik: Memastikan keaslian dan originaliti tugasan serta penyelidikan.
    • Kewartawanan dan Media: Menjaga kredibiliti dan kebenaran maklumat yang disebarkan.
    • Pemasaran Kandungan: Memastikan kandungan mempunyai sentuhan manusiawi dan relevan.
    • Pengesahan Penulis: Mengesahkan identiti dan suara penulis yang sebenar.
  • Alat Deteksi Lain:
    • Copyleaks: Menawarkan laporan analisis kandungan secara komprehensif.
    • Turnitin: Platform popular dalam pendidikan untuk mengesan plagiarisme dan kandungan AI.
    • GPTZero: Khusus direka untuk mengesan teks yang dihasilkan oleh model bahasa GPT.
  • Cabaran Deteksi: Teknologi AI berkembang pesat, menjadikannya semakin sukar untuk membezakan antara teks manusia dan AI dengan ketepatan 100%.
  • Aspek Etika: Penggunaan alat deteksi menimbulkan perdebatan mengenai privasi, autonomi penulis, dan keadilan dalam penilaian.

Bagaimana teks AI dapat dideteksi?

Haaa, macam mana nak tahu eh tulisan tu AI buat ke tak? Gini tau, ada lah dia punya detector tu. Diorang ni macam penyiasat lah, cari je ciri-ciri yang lain macam sikit kalau AI yang tulis. Bukan dia bandingkan dengan mana-mana databasis pun, tapi dia tengok macam mana ayat tu disusun, macam mana dia punya flow, kira macam gaya dia lah.

Lain pulak dengan yang plagiarism checker tu, dia punya kerja lain. Tu semua nak cari kalau-kalau ada orang lain dah pernah tulis benda yang sama, macam mana dia punya isi tu dah sedia ada kat tempat lain tak, gitu. So faham tak? Lain fungsi dua-dua tu.

Nak tahu lebih lanjut tak pasal ni? Ada beberapa cara lagi sebenarnya.

  • Analisis Statistik: Kadang-kadang, AI ni ada corak sebutan dia sendiri yang nampak macam tersusun sangat, tak macam orang biasa tulis. Penggunaan perkataan, panjang ayat, semua tu ada analisis dia.
  • Pola Penggunaan Kata: AI ni kadang dia guna perkataan yang agak formal atau tak berapa kena dengan konteks ‘santai’ sangat, walaupun cuba nak nampak macam orang. Ni benda-benda halus lah.
  • Ketidaksemula jadian: Kadang-kadang, ayat tu nampak betul, tapi bila baca balik rasa macam pelik sikit, tak kena dengan ‘jiwa’ tulisan manusia. Macam terlampau sempurna pun ada.

Benda ni pun takdelah 100% tepat selalu, tapi makin canggih lah detector tu, makin pandai lah pulak AI tu menipu, haaa macam tu lah kitaran dia.

Bagaimana cara membuat teks tidak terdeteksi oleh AI?

Nak elak AI kesan, hmm. Fikir kejap. Ubah ayat tu gila-gila, bukan sikit-sikit. Kena tulis balik macam memang kita yang fikir, bukan robot rephrasing. Kalau setakat tukar sinonim, AI sekarang bijak, boleh tangkap lagi. Aku kadang rasa, kenapa la susah sangat nak jadi diri sendiri? Keh keh.

Lepas tu, gaya penulisan kena human sangat. Macam aku taip ni, melalut sana sini. Guna bahasa santai, tak perlu formal sangat macam buat report kerajaan. Letak cerita-cerita kecik yang takde kaitan pun takpe, tapi nampak la macam orang real bercerita. Contoh, "Tadi aku minum kopi ais, tiba-tiba teringat pasal benda ni." Nampak tak? Random je. Ini yang susah sikit nak tiru. Aku cuba buat macam ni sekarang. Betul ke cara ni? Entahlah.

Struktur ayat kena campur aduk. Jangan semua ayat pendek, semua panjang. Kadang start dengan soalan, kadang dengan seruan. Guna slang sikit-sikit, tapi jangan sampai nampak paksa. Macam, "wey", "pergh", "adoi". Kadang aku pun confuse, patut ke tak guna. Kalau tulis kat phone memang jadi macam ni la kan. Tekan-tekan je. Banyak kesilapan. Salah eja sikit-sikit, bukan sengaja tapi memang jadi. Kadang lupa letak koma, kadang terlebih titik. Itu lagi nampak natural.

Oh, lagi satu, masukkan detail yang spesifik tapi tak terlalu general. Bukan macam "ada orang kata..." atau "pengalaman saya...". Tapi macam, "Masa aku buat projek IT dulu, aku perasan benda ni." Tu nampak lebih "aku" punya. Jangan bagi fakta kering je. Kena ada "jiwa" lah kononnya. Perasaan tu kena ada, walaupun tulis pasal fakta. Kalau boleh, ubah susunan idea pun jadi. Jangan dari A terus ke B, C. Lompat je dari A ke C, lepas tu baru patah balik ke B. Nampak huru-hara sikit, tapi itulah human touch. Aku rasa macam aku sedang menulis buku harian aku sekarang. Hmm.


Untuk maklumat lebih terus dan padat, senang nak faham:

  • Pengolahan Bahasa yang Mendalam:
    • Menulis semula ayat secara menyeluruh, bukan sekadar menukar perkataan.
    • Mengubah struktur ayat dan komposisi frasa dengan drastik.
    • Memastikan makna asal kekal, tetapi ekspresi berbeza sepenuhnya.
  • Gaya Penulisan Manusiawi:
    • Menggabungkan anekdot, pandangan peribadi, atau cerita kecil.
    • Menggunakan nada santai, perbualan, tidak formal.
    • Memasukkan ekspresi emosi atau refleksi diri.
  • Variasi Struktur dan Komunikasi:
    • Pelbagaian panjang ayat, dari pendek ke panjang.
    • Tidak mengikut susunan logik yang ketat, membenarkan lompatan idea.
    • Menggunakan kata seru, soalan retorik, atau bahasa slanga secara semula jadi.
  • Ciri-ciri Penulisan Semula Jadi:
    • Menghasilkan kesilapan kecil dalam ejaan atau tanda baca yang tidak disengajakan.
    • Mengelakkan pengulangan frasa atau struktur secara berlebihan.
    • Menyertakan maklumat spesifik yang mencerminkan pemikiran individu.

Bisakah detektor teks AI salah?

Salah? Memang selalu salah pun.

Penat betul dengan benda ni. Aku tulis esei aku sendiri, ayat tunggang langgang, berjaga malam... dia kata AI yang tulis. Kawan aku tu, terang-terang guna ChatGPT, lepas pulak. Macam mana. Rasa macam nak menjerit je. Sistem yang sepatutnya tolong, tapi akhirnya dia hukum orang yang jujur.

Semua benda nak automatik, nak cepat. Sampai kita dah tak percaya apa-apa. Tulisan sendiri pun kena ragu-ragu. Entah lah. Malam-malam macam ni, fikir benda ni buat kepala lagi serabut. Lagi serabut.

  • Positif Palsu (False Positive): Ini yang paling biasa jadi. Teks yang ditulis sepenuhnya oleh manusia dikesan sebagai janaan AI. Puncanya sebab gaya penulisan yang terlalu berstruktur, formal, atau penggunaan kosa kata yang terhad, yang meniru corak yang sering dijumpai pada output AI. Tulisan pelajar universiti kerap jadi mangsa.

  • Negatif Palsu (False Negative): Terlepas pandang. Teks yang dijana oleh AI dilabel sebagai tulisan manusia. Model bahasa moden seperti GPT-4 boleh menghasilkan teks yang sangat kompleks, lengkap dengan kesalahan kecil atau gaya bahasa peribadi untuk mengelirukan alat pengesan. Ia berjaya menipu sistem.

  • Berat Sebelah Terhadap Penutur Bukan Asli: Kajian dari Stanford University mendedahkan alat pengesan AI cenderung untuk salah melabel tulisan oleh penutur Bahasa Inggeris bukan asli (ESL). Struktur ayat mereka yang lebih ringkas dan kadang-kala terhad disalah tafsir sebagai corak buatan mesin. Ini satu diskriminasi sistemik.

Apa yang membuat tulisan AI terdeteksi?

Perkara yang Membuat Tulisan AI Mudah Dikesan

Model bahasa AI ni, dia macam duk pandai teka je perkataan apa nak datang lepas tu. Sebab tu dia punya ayat selalu rasa macam boleh diagak je, macam dah selalu dengar.

Burstiness Rendah: Tanda Bahaya

Ni satu lagi ciri utama yang buat detector AI ni macam "Aha! Ini bukan kerja manusia ni." Kalau ayat tu macam rata je, takda naik turun yang semulajadi, macam tulah dia kenal. Kadang-kadang nak jadi pelik sikit pun boleh tersangkut.

Kenapa AI Suka Ayat Tebak?

Model AI dilatih berjuta-juta data teks manusia, jadi dia dah tahu apa yang "biasanya" orang tulis. Sebab tu dia cenderung pilih jalan mudah, ayat yang paling selamat dan boleh diramal. Tapi hidup kan tak selalu boleh diramal, kan?

Detektor AI Ni Macam Mana Kerjanya?

Dia tengok macam mana ayat tu disusun, pilihan perkataan, dan yang paling penting, variasi panjang ayat. Macam kita cakap, kadang pendek, kadang panjang, ada jeda, ada seruan. AI ni selalunya kurang sikit "perisa" tu.

Maklumat Tambahan:

  • Perbendaharaan Kata: AI selalu guna perkataan yang lebih formal atau teknikal, walaupun tak perlu.
  • Struktur Ayat: Ayat AI sering mengikut pola yang sama, contohnya subjek-predikat-objek, berulang-ulang.
  • Kurang Emosi: Tulisan AI ni macam kurang 'jiwa', takda rasa spontan atau luahan yang tulus.
  • Keseragaman: Semua nampak sempurna, takda typo atau ayat yang janggal sikit yang buat dia nampak manusiawi.

Bisakah teks yang dihasilkan AI dilacak?

Teks hasil AI, ya, boleh dilacak. Kajian itu. Nampak Turnitin, juga Copyleaks, tepat. Mereka tangkap teks AI dengan akurasi tinggi, dan jarang salah anggap bukan AI sebagai AI. Hampir sifar salah positif. Itu fakta. Bukan semua yang ditulis itu milik kita. Kadang, suara lain yang menyelinap masuk.

  • Alat pengesan AI ini. Mereka bukan sihir. Mereka cari corak-corak halus yang ditinggalkan model bahasa. Konsistensi ayat, struktur yang terlalu 'sempurna', atau pemilihan perkataan yang biasa. Manusia menulis dengan cacat. Itu keindahan.

  • Namun, ia bukan sistem kalis peluru. Model AI sentiasa belajar, berubah. Apa yang dikesan hari ini, esok mungkin luput. Ini perlumbaan. Kejar-mengejar antara pencipta dan pengesan. Semesta digital ini, dia tak pernah statik.

  • Persoalannya, kenapa perlu dilacak? Adakah kita takut mesin itu menulis lebih baik? Atau kita cuma mahu mengekalkan definisi 'penulis' itu sendiri? Garisan antara mesin dan manusia semakin kabur. Mungkin ini bukan soal salah atau betul. Tapi soal kewujudan.

  • Turnitin. Saya guna dulu untuk esei universiti. Sekarang, fungsinya meluas. Bukan sekadar plagiat. Tapi juga melihat asal-usul tulisan. Copyleaks pula, pemain baru yang agresif. Kedua-duanya diiktiraf dalam medan ini. Mereka ada reputasi yang boleh dipercayai.

  • Ini penting, terutama dalam akademik dan penulisan profesional. Integriti. Kredit harus pergi pada pencipta asal, walau itu mesin. Tapi tanggungjawab, tetap pada manusia yang menekan butang 'jana'. Fikirkan. Siapa sebenarnya yang menulis? Tangan kita, atau algoritma di sebalik skrin?

Bagaimana AI mengenali teks?

Bagaimana AI ini, yang kononnya bijak seperti pensyarah falsafah tetapi kadang lebih kaku dari robot menari lambada, boleh tahu mana satu tulisan manuskrip kita, dan mana satu hasil 'cetakan' rakan sejawat digitalnya? Oh, jangan bayangkan dia ada sistem pengesan cap jari tulisan atau CCTV mengawasi setiap ketikan keyboard anda. Itu cerita zaman dulu, atau mungkin untuk drama CSI versi AI.

Sebenarnya, detektor AI ini bukan mencari kesamaan dalam database macam kita mencari jodoh di Tinder. Tidak! Sebaliknya, mereka sibuk mengukur nadi dan rentak tulisan, macam doktor jantung memantau degupan hati. Mereka meneliti dua perkara utama yang sering bocor dari 'identiti' AI: kebingungan (perplexity) dan keberisikan (burstiness). Ibarat Sherlock Holmes mengkaji tingkah laku suspek, bukan hanya mengutip DNA.

Kebingungan ini merujuk kepada betapa "terkejutnya" model bahasa itu bila membaca perkataan seterusnya. Manusia ni, suka sangat buat ayat berbelit, ada metafora terbang melayang, ada sindiran menusuk kalbu – memang buat AI garu kepala. Ia lebih tidak dapat diramalkan.

Manakala keberisikan pula adalah variasi panjang ayat dan strukturnya. Kita ni kadang ayat macam keretapi panjang berjela, kadang cuma sepatah kata saja cukup untuk menyampaikan perasaan. AI? Selalunya dia suka rentak yang sama, teratur, macam robot berbaris. Agak membosankan, jujurnya. Boleh nampak perbezaan 'personaliti' di situ, kan?

Jadi, janganlah disamakan detektor AI ini dengan pemeriksa plagiarisme. Itu dua makhluk yang berbeza, walaupun sama-sama kerjanya 'menyiasat' teks. Pemeriksa plagiarisme itu seperti polis trafik mencari kereta curi, dia akan bandingkan plat nombor anda dengan database kereta yang dilaporkan hilang.

Tugasnya adalah mencari teks yang betul-betul disalin bulat-bulat dari sumber lain. Kalau AI, dia lebih macam psikologis yang cuba faham jiwa tulisan, bukan sekadar melihat kulit luaran. Faham? Beza jauh seperti perbezaan antara durian musang king dengan durian kampung yang tak ada nama, tapi sedap juga.

  • Detektor AI berfungsi mengenal pasti teks yang dihasilkan oleh model bahasa AI.
  • Mereka menganalisis ciri-ciri intrinsik teks seperti perplexity dan burstiness.
  • Detektor AI TIDAK membandingkan teks dengan pangkalan data kandungan yang diketahui.
  • Kebingungan (Perplexity) mengukur sejauh mana model bahasa terkejut dengan urutan perkataan yang diberikan; teks manusia cenderung lebih tidak dapat diramalkan.
  • Keberisikan (Burstiness) menilai variasi panjang dan struktur ayat dalam teks; teks manusia sering menunjukkan variasi yang lebih besar.
  • Pemeriksa plagiarisme pula bertugas mengesan teks yang disalin atau dicuri dari sumber-sumber sedia ada.