12/26/2025 10:45:00 AM
.

Google tố SerpApi vi phạm bản quyền và thu thập dữ liệu tìm kiếm trái phép


Ngày 19/12/2025, Google đệ đơn kiện SerpApi lên tòa án Mỹ với cáo buộc công ty cung cấp API này cố tình vượt qua các hàng rào kỹ thuật để thu thập và khái thác trải pháp các nội dung có bản quyền từ các trang kết quả Google Search.

Cụ thể, Google cho biết đã nộp đơn kiện lên Tòa án Liên bang Khu vực Bắc California, yêu cầu xử lý SerpApi LLC vì hành vi né tránh các biện pháp bảo vệ truy cập để tự động thu thập nội dung có bản quyền xuất hiện trong kết quả tìm kiếm. Đơn kiện dài 13 trang xác định SerpApi là bị đơn trong vụ án số 25-10826, với cáo buộc vi phạm nghiêm trọng Đạo luật Bản quyền Thiên niên kỷ Kỹ thuật số, gọi tắt là DMCA.

Theo Google, SerpApi đã thực hiện hàng tỷ truy vấn tự động nhằm vượt qua hệ thống bảo vệ SearchGuard, công nghệ được Google triển khai từ tháng 1/2025 để ngăn chặn bot và hoạt động thu thập dữ liệu trái phép. SearchGuard chủ yếu hoạt động thông qua các thử thách JavaScript, yêu cầu trình duyệt gửi thông tin xác thực nhằm chứng minh truy vấn đến từ người dùng thật. Với người dùng thông thường, quá trình này diễn ra liền mạch, nhưng với công cụ tự động, việc truy cập kết quả tìm kiếm và các nội dung có bản quyền sẽ bị chặn.

Google cho biết họ đã đầu tư “hàng chục nghìn giờ công và hàng triệu USD” để phát triển SearchGuard, nhằm bảo vệ các nội dung được cấp phép xuất hiện trong các tính năng như Knowledge Panels, Google Shopping và Google Maps. Đây là những khu vực hiển thị hình ảnh chất lượng cao, mô tả sản phẩm, đánh giá người dùng và nhiều dữ liệu có giá trị khác mà Google phải ký hợp đồng cấp phép với các đối tác nội dung.

Đơn kiện cáo buộc rằng ngay sau khi SearchGuard được triển khai và chặn hiệu quả hoạt động của SerpApi, công ty này đã nhanh chóng phát triển các phương thức né tránh mới. Nhà sáng lập SerpApi, ông Julien Khaleghy, từng mô tả quá trình này là “tạo ra các trình duyệt giả với nhiều địa chỉ IP khác nhau để Google xem như người dùng bình thường”. Các kỹ thuật bị cáo buộc bao gồm giả mạo thông tin thiết bị, phần mềm, vị trí địa lý, hoặc chia sẻ quyền truy cập hợp lệ từ một số truy vấn thật sang hàng loạt máy không được phép trên toàn cầu.

SerpApi được thành lập năm 2017 tại Austin, Texas, với mô hình kinh doanh cung cấp API cho phép khách hàng “scrape Google”, tức tự động trích xuất dữ liệu từ Google Search. Công ty này quảng bá các gói dịch vụ nhắm trực tiếp vào Knowledge Graph, Google Shopping và Google Maps, đồng thời cam kết khách hàng “không cần quan tâm đến captcha, địa chỉ IP, phát hiện bot hay nguy cơ bị chặn”.

Theo Google, mô hình này đồng nghĩa với việc SerpApi khai thác thành quả đầu tư và chi phí cấp phép nội dung mà Google đã bỏ ra, sau đó bán lại dữ liệu cho bên thứ ba để thu phí, mà không trả bất kỳ khoản thù lao nào cho chủ sở hữu quyền. Hành vi này, theo nguyên đơn, làm xói mòn các mối quan hệ cấp phép nội dung, đồng thời gây tổn hại đến lợi thế cạnh tranh của Google.

Đơn kiện cũng nêu rõ các chi phí hạ tầng mà Google phải gánh chịu. Mỗi truy vấn tự động từ SerpApi đều tiêu tốn tài nguyên xử lý, nhưng không tạo ra doanh thu bù đắp. Trong khi đó, điều khoản sử dụng của Google nghiêm cấm truy cập tự động vào nội dung tìm kiếm, đặc biệt khi vi phạm các chỉ dẫn máy đọc được như robots.txt. Google khẳng định robots.txt của họ đã nêu rõ rằng kết quả tìm kiếm không được phép bị thu thập tự động.

Về mặt pháp lý, Google viện dẫn Điều 1201(a)(1)(A) của Luật Bản quyền Hoa Kỳ, cấm hành vi vượt qua các biện pháp công nghệ kiểm soát quyền truy cập vào tác phẩm có bản quyền. Mỗi hành vi vi phạm có thể bị áp dụng mức bồi thường theo luật định từ 200 đến 2.500 USD. Ngoài ra, Điều 1201(a)(2) còn cấm việc sản xuất, cung cấp hoặc tiếp thị các công cụ được thiết kế nhằm vượt qua các biện pháp bảo vệ này. Google cho rằng SerpApi không chỉ thực hiện hành vi né tránh, mà còn công khai quảng bá khả năng đó như giá trị cốt lõi của sản phẩm.

Google ước tính khối lượng truy vấn của SerpApi đã tăng tới 25.000% trong hai năm qua, hiện đạt hàng trăm triệu truy vấn tự động mỗi ngày. Với quy mô này, tổng mức trách nhiệm pháp lý tiềm tàng có thể lên tới con số khổng lồ, vượt xa doanh thu thường niên chỉ vài triệu USD mà SerpApi được cho là đang đạt được. Đơn kiện thậm chí thừa nhận rằng SerpApi “sẽ không thể chi trả” nếu tòa án áp dụng đầy đủ mức bồi thường theo luật định.

Ngoài yêu cầu bồi thường, Google đề nghị tòa án ban hành lệnh cấm vĩnh viễn, buộc SerpApi chấm dứt mọi hành vi vượt qua biện pháp bảo vệ, đồng thời cấm thiết kế, sản xuất, tiếp thị hoặc phân phối bất kỳ công nghệ nào phục vụ mục đích này. Google cũng yêu cầu tiêu hủy các công cụ, thiết bị liên quan đến hành vi vi phạm, cùng với việc thanh toán án phí, phí luật sư và lãi suất liên quan.

Đây là vụ kiện lớn thứ hai nhắm vào SerpApi trong năm 2025. Trước đó, vào ngày 22/10, Reddit đã khởi kiện SerpApi cùng một số công ty khác, cáo buộc họ vượt qua cả biện pháp chống thu thập dữ liệu của Reddit lẫn SearchGuard của Google để lấy nội dung Reddit từ trang kết quả tìm kiếm. Đơn kiện của Reddit ví các bị đơn như “những kẻ cướp xe chở tiền”, không vào được két sắt ngân hàng thì chuyển sang tấn công xe bọc thép.

Vụ việc diễn ra trong bối cảnh căng thẳng gia tăng giữa các nền tảng, nhà xuất bản và công ty công nghệ xoay quanh quyền truy cập nội dung và dữ liệu huấn luyện AI. Nhiều nhà xuất bản đã lên tiếng phản đối việc AI thu thập nội dung trái phép, coi đây là mối đe dọa sống còn đối với báo chí số. Thống kê được công bố tại một hội nghị ngành cho thấy hơn 35% các website hàng đầu đã chặn bot của OpenAI, trong khi số vụ tấn công thu thập dữ liệu tăng hơn 100% so với cùng kỳ năm trước.

Điểm đáng chú ý là chiến lược pháp lý lần này của Google tập trung vào bảo vệ bản quyền, thay vì chỉ dựa vào vi phạm điều khoản sử dụng như nhiều vụ trước. Việc áp dụng DMCA cho các biện pháp bảo vệ kết quả tìm kiếm, vốn chứa nội dung có bản quyền của bên thứ ba, có thể tạo ra tiền lệ quan trọng cho toàn ngành.

SerpApi hiện cung cấp API cho nhiều nền tảng khác như Amazon, Bing, DuckDuckGo, eBay, Walmart, Yelp và YouTube. Điều này khiến giới quan sát nhận định rằng nếu Google thắng kiện, các nền tảng khác có thể sẽ nối bước bằng những hành động pháp lý tương tự để bảo vệ nội dung và mô hình kinh doanh của mình.

Vụ kiện Google, SerpApi vì thế không chỉ là tranh chấp giữa hai doanh nghiệp, mà còn phản ánh cuộc chiến rộng lớn hơn về quyền kiểm soát dữ liệu, bản quyền và giá trị kinh tế của nội dung số trong kỷ nguyên AI và tự động hóa.   

Với việc dựa trên khung pháp lý của Đạo luật Bản quyền Thiên niên kỷ Kỹ thuật số, vụ kiện được đánh giá sẽ mở ra tiền lệ mới trong việc bảo vệ nội dung được cấp phép trên nền tảng tìm kiếm.

Nhanhieuviet (Theo Tạp chí Sở hữu Trí tuệ - Link gốc)
.
.
.
.

                   

TRUNG TÂM THÔNG TIN CÔNG NGHIỆP VÀ THƯƠNG MẠI - BỘ CÔNG THƯƠNG.

Giấy phép của Bộ Thông tin và Truyền thông số 113/GP-TTĐT, cấp ngày 03/6/2024.
Địa chỉ: 655 Phạm Văn Đồng - Phường Nghĩa Đô - Thành phố Hà Nội.
Điện thoại: 024 3934 1911  -  Email: info@nhanhieuviet.gov.vn