Khả năng “soi mói” của bạn có giá trị cao trong thời đại AI!

Trong một bài viết tôi đọc gần đây, có 1 thuật ngữ tôi chưa biết là poke holes. Khi tìm hiểu sâu hơn thì từ này kéo về cho tôi một vùng mới để bắt đầu đặt nhiều câu hỏi hơn trong bất kì tình huống sử dụng AI nào.

Poke holes (poke holes in something) là trong tiếng Anh có nghĩa là tìm ra lỗ hổng, điểm yếu hoặc điểm mâu thuẫn trong một ý tưởng, lập luận hay kế hoạch nào đó. À há, có vẻ là việc yêu thích của chúng tôi và chúng ta, vạch lá tìm sâu.

Khi mọi người nói về việc “poking holes” trong AI, nghĩa là họ đang muốn tìm ra các lỗi, giới hạn, định kiến hoặc lỗ hổng bảo mật trong các hệ thống trí tuệ nhân tạo. Vì AI nhìn bề ngoài (có vẻ) rất thông minh và tự tin, việc “tìm lỗ hổng” là quá trình thiết yếu để thử nghiệm xem nó sẽ bị lỗi, nói dối hoặc thất bại ở đâu.

Bản chất của AI: bộ não thiên tài, nhanh chóng nhưng có xác suất

Để biết cách ứng xử với AI, trước hết chúng ta phải hiểu cách nó “nghĩ”. Rất nhiều người dùng hiện nay đang lầm tưởng AI là một cuốn bách khoa toàn thư vạn năng, hoạt động như một cỗ máy toán học tuyệt đối: nhập đầu vào và xuất ra kết quả đúng 100%. Ngoài nhóm không tin AI, bài trừ AI thì còn nhóm nguy hiểm hơn là quá tin vào AI mà không đi qua bất kì kiểm chứng nào.

Nhưng thực tế, bản chất của AI không phải là tư duy logic như con người, mà là xác suất.

AI không thực sự “hiểu” thế giới. Nó chỉ đang thực hiện một nhiệm vụ duy nhất: Dựa trên hàng tỷ dữ liệu đã học trong quá khứ để dự đoán xem từ tiếp theo, hoặc điểm ảnh tiếp theo có khả năng xuất hiện cao nhất là gì.

Chính vì hoạt động theo cơ chế xác suất, AI mắc một căn bệnh gọi là “Hallucination” (Ảo giác). Điều nguy hiểm là nó không nói dối kiểu ấp úng, ngập ngừng; nó bịa ra một câu chuyện, một số liệu, thậm chí là một điều luật không hề tồn tại với một thái độ khẳng định tự tin.

Đã có những luật sư tại Mỹ bị tước bằng hoặc phạt nặng chỉ vì dùng AI để viết văn bản biện hộ, để rồi AI tự “bịa” ra các vụ án tiền lệ cùng số hiệu tòa án hoàn toàn giả mạo. Nếu họ biết cách “poke holes” văn bản của AI trước khi nộp lên tòa, thảm kịch nghề nghiệp đã không xảy ra.

Có khi AI đưa cả nguồn vào trích dẫn nhưng khi click vào nguồn thì không tìm thấy hoặc đọc kỹ thì quan điểm được nêu trong nguồn không giống như AI đã tóm tắt.

Những lỗ hổng của AI mà bạn phải nhận diện được

Khi chúng ta nói về việc tìm lỗ hổng trong AI, chúng ta đang nói về 4 khía cạnh lớn mà bất kỳ người dùng tỉnh táo nào cũng phải nằm lòng:

Lỗ hổng logic và kiến thức

AI xử lý các yêu cầu lặp đi lặp lại rất tốt, nhưng nó lại thường xuyên vấp té trước các câu đố mẹo, các bài toán logic phi tuyến tính hoặc các thông tin mang tính thời sự mới cập nhật. Nếu bạn yêu cầu AI giải một bài toán mà các khuôn mẫu trên mạng chưa từng có, bạn sẽ thấy nó bắt đầu suy luận luẩn quẩn và đưa ra kết quả sai lệch hoàn toàn.

Lỗ hổng định kiến (Bias)

AI được huấn luyện từ dữ liệu do con người tạo ra. Mà dữ liệu của con người thì luôn chứa đựng những định kiến về giới tính, sắc tộc, văn hóa và giai cấp. Khi nạp những dữ liệu này vào, AI vô tình thừa hưởng và khuếch đại những định kiến đó. Nhiều hệ thống quét CV tự động bằng AI đã bị phát hiện đánh rớt các ứng viên nữ chỉ vì dữ liệu lịch sử của công ty đó trong quá khứ phần lớn là nam giới.

Lỗ hổng bảo mật (Jailbreaking)

Các công ty công nghệ luôn dựng lên các hàng rào an toàn để AI không hướng dẫn người dùng làm điều xấu. Thế nhưng, các “hacker mũ trắng” luôn tìm thấy lỗ hổng bằng cách đóng vai, chơi chữ để lừa AI vượt rào, bắt nó cung cấp mã độc hoặc tiết lộ dữ liệu bảo mật. Nếu hệ thống bạn đang dùng có thể bị bẻ khóa dễ dàng như vậy, liệu dữ liệu cá nhân của bạn có thực sự an toàn?

Lỗ hổng so với lời quảng cáo

Hãy tỉnh táo trước những lời mật ngọt của các nhà tiếp thị công nghệ. Họ vẽ ra viễn cảnh AI thay thế hoàn toàn con người. Nhưng thực tế chỉ ra rằng, AI hoàn toàn vô tri trước các sắc thái cảm xúc phức tạp, sự thấu cảm và những tình huống “bất khả kháng” nằm ngoài sách vở.

Nghệ thuật ứng xử với AI để không bị hãm hại =))

Nhận biết được lỗ hổng là một chuyện, nhưng biết cách chung sống và điều khiển AI lại là một nghệ thuật. Hãy biến mình thành một người dùng thông thái bằng các nguyên tắc cốt lõi sau:

Nguyên tắc 1: “Trust, but verify”

Hãy đối xử với AI như một intern cực kỳ thông minh nhưng làm việc không đủ cẩn trọng và có phần hơi lấp liếm. Bạn có thể giao cho nó tìm kiếm thông tin, viết bản nháp, lên ý tưởng. Nhưng khi nhận kết quả, bạn phải là người kiểm tra lại từng số liệu, từng nguồn trích dẫn (hoặc phải có công cụ để làm điều đó). Đặc biệt là trong các lĩnh vực có tác động lớn đến cuộc sống như y tế, tài chính, giáo dục và pháp luật.

Nguyên tắc 2: Áp dụng phương pháp đối chiếu (Triangulation)

Đừng bao giờ chỉ nghe từ một phía. Nếu bạn dùng AI để nghiên cứu một chủ đề quan trọng, hãy thử ném câu hỏi đó cho 2-3 mô hình AI khác nhau. Sau đó, hãy mang kết quả đi kiểm tra chéo một lần nữa trên các công cụ tìm kiếm truyền thống như Google để xem các nguồn báo chí chính thống nói gì.

Tôi cho làm tính tổng của 5 tấm hình chụp các số tiền học viên chuyển, yêu cầu đưa vào bảng bao gồm: ngày chuyển, số tiền và thông tin chuyển qua 3 công cụ Gemini, Claude và Perplexity, thì kết quả đúng thuộc về Claude.

Nguyên tắc 3: Nâng cấp kỹ năng viết prompt

Bạn có thể chủ động “vá” lỗ hổng của AI ngay trong cách bạn ra lệnh cho nó. Ví dụ: nếu không có số liệu hoặc không biết thì trả lời “Tôi không biết”, không đoán hoặc bịa thông tin.

Yêu cầu think step-by-step trước khi đưa ra kết quả cuối cùng. Nó buộc AI phải kích hoạt chuỗi suy luận logic, giúp giảm các lỗi sai.

Nguyên tắc 4: Human in the loop

Luôn có mặt trong các step của AI để kiểm định và kịp thời guide để ra output. Hãy luôn là người gác cổng cuối cùng cho mọi sản phẩm có sự tham gia của AI.

Tôi có hỏi một người anh về việc làm sao anh có thể ngăn chặn và kiểm tra các sai sót AI có thể gây ra? Ngoài việc thiết lập các luật lệ, kinh nghiệm và ranh giới mỗi ngày thì có 1 ý anh nói: đơn giản sẽ giải quyết mọi việc. Đừng để sự FOMO, tâm lý sẽ tụt hậu mà dung nạp lượng lớn những thứ mình sẽ không dùng, không đọc, không hiểu và không có ý định tìm kiếm lại.

“Poke holes” là để tiến bộ

Khi chúng ta liên tục tìm lỗi, vạch vết nứt của AI, nghe có vẻ như chúng ta đang cố bài trừ nó. Nhưng thực tế hoàn toàn ngược lại.

Trong nhiều ngành, có những đội ngũ được trả lương rất cao chỉ để làm một việc duy nhất là đóng vai những kẻ phá hoại, tìm mọi cách để “poke holes”, bẻ khóa, làm cho AI phát điên và đưa ra kết quả sai. Tại sao các ông lớn công nghệ lại tự bỏ tiền ra để người khác phá sản phẩm của mình?

Bởi vì họ hiểu rằng: Chỉ khi tìm ra lỗ hổng sớm, họ mới có thể vá nó lại trước khi thảm họa xảy ra. Việc bạn giữ một tư duy phản biện, một cái đầu lạnh và liên tục hoài nghi AI chứng minh bạn đang làm chủ công nghệ chứ không để công nghệ dẫn dắt. AI suy cho cùng cũng chỉ là một tấm gương phản chiếu kho tàng tri thức (và cả những rác rưởi) của nhân loại. Nó không hoàn hảo vì chính chúng ta không hoàn hảo.

Năng lực thực sự của một con người trong thời đại AI không nằm ở việc bạn biết bấm nút để AI tạo ra 10 bài viết trong 1 phút. Nó nằm ở việc bạn có đủ kiến thức, đủ kỹ năng, đủ sự tinh tế và đủ sự tỉnh táo để nhận ra những ảo giác và sai lầm của nó hay không.

Khi việc sản sinh nội dung từ hình ảnh, video đến bài viết được tự động, nhanh chóng và bất chấp. Con người có nhiều ý định cả trong sáng và đen tối, thì thảm họa dành cho đối tượng thụ hưởng về sau là vô cùng nguy hiểm.

Nó làm cho tôi nhớ lại phim Mission Impossible: Dead reckoning và The final reckoning. Khi thực thể The entity có khả năng thao túng hệ thống toàn thế giới: xóa hết dấu vết, truy cập toàn bộ dữ liệu mật, thay đổi, làm mới chỗ này chỗ kia mà không có cách nào biết đâu là thật đâu là giả, thế giới sẽ sống trong ảo tưởng, bị cầm tù và tàn phá. Ý tưởng đó làm tôi nổi da gà, và tôi biết với tốc độ phát triển của AI hiện tại, chúng ta cũng sẽ sống trong sự hoài nghi đó.

Sản sinh nội dung vô tội vạ không kiểm chứng và sai sự thật chính là tàn phá tương lai của chính chúng ta và con cháu chúng ta.

Hãy học cách hoài nghi một cách lành mạnh. Hãy luôn sẵn sàng “poke holes” vào bất kỳ câu trả lời nào nhận được. Đó là cách duy nhất để chúng ta giữ vững khả năng không bị thao túng trong tương lai.