Hướng dẫn đầy đủ để phát hiện AI Chatbot đạo văn

Spread the love

AI Chatbots như ChatGPT không giới hạn chỉ trả lời câu hỏi của bạn. Họ có thể viết email, thư xin việc, tiểu luận, thơ ca, bài đăng trên blog giống như con người, v.v.

Viết AI giống như một con tắc kè hoa – nó có thể kết hợp với bất kỳ loại văn bản nào khác tốt đến mức bạn khó có thể nhận ra sự khác biệt.

Thật không may, điều này khiến con người chúng ta cực kỳ khó phát hiện khi AI đã viết một cái gì đó thay vì con người. Chắc chắn, tất cả chúng ta đều có thể làm theo lời khuyên của Sherlock Holmes và “loại bỏ những điều không thể”, nhưng ai có thời gian cho việc đó?

Điều gì sẽ xảy ra nếu tôi nói với bạn rằng đoạn văn trên được viết bởi một AI? Vâng, tôi đã yêu cầu YouWrite viết phần giới thiệu nhanh cho bài đăng này, đó là những gì nó nghĩ ra. Khá thuyết phục phải không? Đó là vấn đề, nó quá thuyết phục để bất cứ ai cũng có thể trình bày nó như là công việc của chính họ để kiếm lợi từ nó.

AI không chỉ viết lại nội dung; họ tìm hiểu chủ đề và trình bày nó bằng ngôn ngữ tự nhiên bằng RLHF. Điều này có nghĩa là nội dung được tạo ra sẽ không gây cảm giác máy móc khi đọc cũng như không thể so sánh với dữ liệu có sẵn trực tuyến để phát hiện hành vi đạo văn.

Nắm bắt nội dung do AI tạo ra không hề dễ dàng và tôi sẽ không mang đến cho bạn hy vọng hão huyền rằng bạn có thể nắm bắt nội dung đó với độ chính xác 100%. Tuy nhiên, với một chút công việc thám tử và một số trợ giúp từ các công cụ phát hiện chữ viết AI, bạn có thể bắt được hầu hết các tác phẩm của AI.

Dưới đây, bạn sẽ tìm thấy các cách thủ công để phát hiện đạo văn AI và cả một số công cụ tự động.

Phát hiện đạo văn AI theo cách thủ công 🕵️

ChatGPT thậm chí không phải là một vấn đề lớn khi nói đến đạo văn AI. Có nhiều công cụ thay thế dựa trên cùng công nghệ GPT-3 và được xây dựng để viết. Đây là những thứ rất tiên tiến và được thiết kế đặc biệt để tạo nội dung giống con người rất khó nắm bắt.

Các công cụ phát hiện tự động hơi sai hoặc sai tùy thuộc vào loại nội dung, độ dài và độ phức tạp. Vì vậy, ít nhất là hiện tại, kết nối các dấu chấm theo cách thủ công để tìm hiểu xem bài viết có phải do AI tạo ra hay không là cách tốt nhất.

Dưới đây tôi đã liệt kê một số manh mối phổ biến mà bạn có thể tìm kiếm để nắm bắt nội dung do AI tạo ra.

#1. Thông tin lỗi thời

ChatGPT và AI dựa trên GPT-3 khác đã bị cắt giảm kiến ​​thức vào cuối năm 2021. Mặc dù một số bot AI có công cụ tìm kiếm tích hợp để tìm kiếm thông tin mới nhất, chúng vẫn dựa vào dữ liệu cũ để viết nội dung dài như bài tiểu luận hoặc bài đăng trên blog.

  8 công cụ dịch thuật có sự hỗ trợ của máy tính (CAT) tốt nhất để sử dụng

Nếu bạn nhận thấy bài viết liên tục nói về dữ liệu lỗi thời, cụ thể là trước năm 2021, thì đó có thể là do AI tạo ra.

Trong ảnh chụp màn hình bên dưới, tôi đã yêu cầu YouWrite cho tôi biết về FIFA World Cup gần đây và đây là những gì nó đưa ra.

Nó nói về World Cup 2018 thay vì 2022 gần đây. Mặc dù công cụ này được cập nhật để nói về các sự kiện gần đây như World Cup 2022, nhưng để viết các bài đăng dài, nó vẫn sử dụng dữ liệu lỗi thời mà nó được xây dựng.

#2. Sử dụng cùng một cấu trúc câu cho mô tả

Khi viết mô tả về nhiều sản phẩm/ứng dụng, AI thường sử dụng cùng một cấu trúc câu mà nó chỉnh sửa cho phù hợp với mô tả của sản phẩm. Các mô tả thường bắt đầu bằng cùng một từ, chẳng hạn như The, It, A hoặc tên của sản phẩm. Các mô tả cũng có một tiêu điểm chuyên dụng mà nó lặp lại.

Ví dụ, bên dưới, tôi đã yêu cầu ChatGPT cho tôi biết về “các trang web việc làm nhập liệu”. Bạn có thể thấy tất cả các mô tả đều bắt đầu bằng chữ “A” và có trọng tâm nghiêm ngặt.

Tôi cũng đã hỏi YouChat câu hỏi tương tự, và nó đã làm điều tương tự và lặp lại tên của từng trang web ngay từ đầu và bản thân các mô tả trông giống như một phiên bản được viết lại của mỗi trang.

Nếu bài viết mà bạn đang phân tích có mô tả về bất kỳ thứ gì tương tự về bản chất, thì đó là một cách tuyệt vời để nắm bắt bài viết của AI.

#3. Sử dụng câu ngắn

Đối với hầu hết các bài viết, AI sẽ sử dụng nhiều nhất các câu có một dòng với một dấu phẩy. Có thể họ cố gắng giảm thiểu khả năng mắc lỗi, nhưng họ tránh viết những câu dài có thể yêu cầu sử dụng dấu hai chấm, dấu chấm phẩy hoặc nhiều dòng ngang.

Tôi biết đây không phải là manh mối tốt nhất để nắm bắt bài viết của AI, nhưng nó đáng để xem xét để chứng minh thêm sự nghi ngờ của bạn.

#4. Có thể cung cấp thông tin không chính xác

Đối với những câu hỏi phức tạp thường liên quan đến một số loại hướng dẫn, AI có thể không hiểu ý định và cung cấp thông tin không chính xác. Ở đây tôi không nói về thông tin lỗi thời, họ chỉ tự tin nói với bạn những thông tin sai lệch khi họ không nắm bắt được chủ đề.

Ví dụ: tôi đã yêu cầu YouWrite cho tôi biết “cách root điện thoại Android mà không cần PC”. Nó vẫn chỉ cho tôi các phương pháp liên quan đến việc sử dụng PC tại một số điểm trong hướng dẫn.

#5. Không thêm ý kiến ​​​​cá nhân

Khi nói về điều gì đó, AI chỉ nói về những sự thật đã biết. Không giống như con người, nó sẽ không nói về trải nghiệm cá nhân của mình với nó. Mặc dù AI có thể được hướng dẫn để tạo một bài viết thực hành, nhưng chúng có xu hướng tránh làm điều đó theo mặc định.

Nếu bạn nhận thấy bài viết chỉ nói về những sự thật nổi tiếng, thì rất có thể nó được viết bởi một AI. Ví dụ: khi nói về một ứng dụng, nó sẽ nói về các tính năng của nó thay vì điều hướng mượt mà như thế nào hoặc cách thực sự sử dụng ứng dụng.

  10 RegEx Tester cho JavaScript, Python, PHP, Golang, Ruby, v.v.

#6. Giải thích ngắn gọn

Vì AI bị giới hạn bởi kiến ​​thức hiện có nên chúng có xu hướng viết những lời giải thích và mô tả ngắn gọn. Theo kinh nghiệm của tôi, nếu họ nói về một chủ đề cụ thể – chẳng hạn như root Android – thì họ sẽ giải thích tối đa trong vòng 2-3 đoạn. Và đối với những thứ như ứng dụng hoặc sản phẩm, phần mô tả thường không dài quá 1 đoạn.

Con người có thể viết sâu về một thứ gì đó, bao gồm các tính năng, hạn chế, trải nghiệm cá nhân, giá cả, v.v. Mặt khác, AI thường tập trung vào các tính năng chính hoặc điểm nổi bật nên bài viết cũng ngắn. Nếu người hướng dẫn hỏi thêm chi tiết, khả năng thông tin không chính xác sẽ tăng lên đáng kể.

#7. Kiểm tra lịch sử của nhà văn

Là giáo viên hoặc quản trị viên web, nếu bạn có quyền truy cập vào bài viết hoặc bài tập trước đây của người viết, bạn nên so sánh nó với bài viết mà bạn nghi ngờ. Rất khó có khả năng tác giả có phong cách viết tương tự như AI. Mặc dù AI có thể thay đổi tông màu viết, nhưng phong cách mà nó chọn khá chung chung và nó không thể sao chép tông màu của bạn.

Lấy ví dụ về đoạn văn do AI tạo ra trong phần giới thiệu của bài đăng này. Ai đã đọc những bài viết trước đây của tôi đều có thể dễ dàng nhận thấy phong cách viết của tôi hoàn toàn khác so với nó.

Bạn chỉ cần đọc 2-3 tác phẩm trước của người viết và xem nó có phù hợp với phong cách viết của người viết đáng ngờ hay không.

Công cụ phát hiện đạo văn AI

Có rất nhiều công cụ có thể phát hiện nội dung do AI viết. Tuy nhiên, độ chính xác của chúng khác nhau và có thể không thành công tùy thuộc vào loại nội dung và độ dài.

Tôi đã thử nghiệm các công cụ này bằng các loại nội dung khác nhau do ChatGPT, GPT-3 Playground, WriteSonic, Rytr và YouWrite tạo ra. Họ đã quản lý để phát hiện tất cả các loại nội dung do ChatGPT và GPT-3 Playground tạo ra.

Mặc dù chúng có kết quả khác nhau đối với các công cụ viết chuyên dụng, nhưng điều thú vị là tất cả chúng đều không phát hiện được YouWrite, tôi đoán đó là do YouWrite mắc lỗi giống con người nhằm mục đích tránh bị phát hiện.

Tôi khuyên bạn nên sử dụng các công cụ này cùng với việc kiểm tra nội dung theo cách thủ công. Đầu tiên, hãy phân tích nội dung bằng một trong những công cụ này, sau đó kiểm tra thủ công mọi manh mối để xác nhận thêm sự nghi ngờ.

Dưới đây tôi liệt kê những cái mang lại kết quả tốt nhất và dễ sử dụng nhất:

Lưu ý: Để trình diễn, tôi sẽ sử dụng văn bản được tạo từ WriteSonic về “Lợi ích của Xoài”.

#1. Nội dung ở quy mô

Tôi nhận thấy trình phát hiện nội dung AI của Content At Scale là chính xác nhất đối với hầu hết các thử nghiệm mà tôi đã thực hiện. Nó cho phép bạn quét tối đa 2500 ký tự mỗi lần quét và đưa ra dự đoán tỷ lệ phần trăm hiển thị mật độ nội dung thực hoặc giả.

Nội dung có hơn 60% giả mạo có thể an toàn khi cho rằng được viết bởi nội dung AI, ít nhất là phần lớn nội dung đó. Trong ảnh chụp màn hình bên dưới, bạn có thể thấy 96% nội dung là giả mạo mà tôi đã tạo hoàn toàn bằng AI.

  Cách (và tại sao) chọn tham gia Google Recording Storage

#2. GPTZero

Nếu bạn muốn xem chính xác nội dung nào được tạo bởi AI, thì GPTZero là một lựa chọn tốt. GPTZero không chấm điểm nội dung. Thay vào đó, nó làm nổi bật nội dung chính xác có thể do AI tạo ra.

Mặc dù nó hiển thị điểm phức tạp và bùng nổ để có ý tưởng về tính ngẫu nhiên trong văn bản, nhưng quan trọng hơn, nó hỗ trợ 5000 ký tự cho mỗi lần quét và cũng có thể tải tệp lên. Quét nội dung lớn giúp cải thiện độ chính xác rất nhiều.

#3. Máy dò đầu ra GPT-2

Những người tạo ChatGPT cũng cung cấp một bot để phát hiện công việc của chính họ. Vì GPT-2 và GPT-3 chỉ khác nhau về tổng dữ liệu được sử dụng để đào tạo nên trình phát hiện GPT-2 này cũng hoạt động tốt đối với các AI dựa trên GPT-3.

Không có giới hạn về số lượng nội dung mà nó có thể quét, vì vậy nó hoàn hảo để phát hiện nội dung rất dài do AI tạo ra. Tôi cũng nhận thấy độ chính xác của nó rất tốt, đặc biệt đối với nội dung do ChatGPT tạo ra. Tuy nhiên, nó hơi mất dự đoán, vì vậy chỉ xem xét kết quả của nó khi nó hiển thị hơn 50% nội dung là giả mạo.

#4. Trình phát hiện nội dung AI của nhà văn

Kết quả của Trình phát hiện nội dung AI của nhà văn có vấn đề khi phát hiện nội dung từ các công cụ viết AI, nhưng nó hoạt động rất tốt đối với nội dung do ChatGPT tạo. Bạn có thể quét 1500 ký tự mỗi lần quét và thậm chí thêm URL của nội dung nếu nội dung đó đã được xuất bản.

Đối với thử nghiệm của tôi, văn bản do AI tạo ra, nó cho biết 94% nội dung là do con người tạo ra, một con số khá khác biệt so với các công cụ khác. Tuy nhiên, nó vẫn đáng để sử dụng để phát hiện nội dung ChatGPT, đặc biệt nếu nội dung đó đã được xuất bản.

#5. Dự thảo & Mục tiêu

Một công cụ phát hiện viết AI đơn giản nhưng mạnh mẽ. Theo kinh nghiệm của tôi, Bản nháp & Mục tiêu cung cấp kết quả tương tự như Nội dung theo tỷ lệ, nhưng nó không có giới hạn số từ để bạn có thể quét qua các bài viết dài. Tuy nhiên, thời gian quét của nó tăng lên dựa trên lượng nội dung bạn quét.

Đối với văn bản ví dụ của tôi, nó nói rằng 94% văn bản là do AI tạo ra.

Suy nghĩ của tôi 💭

Cá nhân tôi nghĩ rằng sự trợ giúp của AI thực sự là một cách tuyệt vời để loại bỏ rào cản của người viết, thu thập tất cả thông tin ở một nơi và tìm cảm hứng. Tuy nhiên, nó không bao giờ nên thay thế chữ viết của con người vì AI chỉ giới hạn ở những kiến ​​thức đã biết.

Bạn cũng có thể khám phá một số công cụ kiểm tra đạo văn tốt nhất để ngăn chặn việc sao chép.

x