1900 2226

Mô hình reCAPCHA: Biến người dùng Internet thành “nhân công miễn phí”


Nếu bạn đã từng trả lời một trong những mẫu reCAPCHA thì xin chúc mừng bạn. Thông tin bạn nhập giờ đã nằm trong một bài báo của tờ New York Time lừng danh và được lưu trữ tại thư iện lớn nhất thế giới Google Books.

Có lẽ người dùng Internet đã quá quen thuộc với Captcha, là một công cụ khá phiền toái để chứng minh người dùng thật sự là con người chứ không phải robot. Captcha được nhiều trang web sử dụng để phòng tránh các cuộc tấn công từ chối dịch vụ hoặc hành vi đánh cắp dữ liệu . Tuy nhiên, Luis nhà sáng lập cho rằng, tuy mỗi người chỉ mất vài giây để hoàn tất, tính tổng cộng số người dùng khổng lồ trên thế giới  thì mỗi ngày có đến hàng trăm ngàn giờ lao đồng lãng phí vào việc nhập mã captcha.

Nhằm tránh lãng phí những giờ lao động quý giá này, Luis đã cho ra đời reCAPTCHA vào năm 2007, về cơ bản nó vẫn là một chương trình captcha thông thường, đây còn là một công cụ dễ rất sử dụng cho các chủ sở hữu website. Và cũng không lâu sau đó, recaptcha được ứng dụng rộng rãi. Nhưng ít ai biết được mô hình kinh doanh đằng sau chương trình miễn phí này.

Hàng chụp người dùng đang bị biến thành những cỗ máy đánh chữ đều đặn mỗi ngày, điện tử hóa hàng ngàn quyển sách, bài báo, tạp chí mà không ai hay biết.

Vậy reCAPTCHA hoạt động như thế nào?

reCAPTCHA yêu cầu người dùng phải nhập 2 chữ cái khác nhau thay vì 1 chữ so với các phần mềm khác. ReCAPTCHA không tự tạo những kiểu chữ khó nhìn mà lấy hẳn hình ảnh từ các văn bản như sách, báo, tờ rơi,..  mà phần mềm OCR không thể giải quyết được. OCR luôn được sử dụng để chuyển các trang sách, báo, tạp chí từ bản in sang bản điển tử. Tuy nhiên, nếu trang giấy có dấu hiệu cũ, sờn hoặc xuống cấp thì OCR sẽ không nhận diện được.

Quay lại với reCAPTCHA, trong 2 kí tứ mà công cụ này thách thức ngời dùng internet thì một chữ đã được nhận diện vfa lưu trong kho dữ liệu và chữ còn lại sẽ đến từ danh sách mà OCR không đọc được. Nếu có 6 người dùng cùng sử dụng một chữ để thay thế cho hình ảnh mà phần mềm không đọc được thì reCAPTCHA sẽ xem như là một từ đã được “đọc” thành công.

Với khả năng đọc chính xác gấp 6 lần người thường, reCAPTCHA đã ký được hợp đồng từ tờ báo danh tiếng của Mỹ để điện tử hóa tất cả các bài viết cũ. Vào năm 2009, reCAPTCHA nhanh chóng được Google mua lại với giá trị ít nhất là 30 triệu USD.

>>> Xem thêm:iOS 12.1.1 được phát hành với hỗ trợ nhà cung cấp dịch vụ eSIM mở rộng




Bài viết liên quan