Bot Thu Thập Dữ Liệu Và Cuộc Chiến Dữ Liệu Ngầm

&#một3;

Các doanh nghiệp triển khngười nào những bot bảo mật để xâm nhập vào những trang web của đối thủ. Các đối thủ này sẽ nỗ lực nhận diện và chặn những bot bảo mật xâm nhập vào, đồng thời tạo nên một cuộc chạy đua tiếp tiến.

&#một3;

Các doanh nghiệp đang sở hữu một trận chiến dữ liệu vô hình thông qua hình thức trực tuyến. Và điện thoại của khách hàng sở hữu thể là một người lính vô tình.

Các nhà bán lẻ từ Amazon và Walmart cho tới những doanh nghiệp khởi nghiệp nhỏ muốn biết đối thủ của họ tính phí gì. Các nhà bán lẻ truyền thống sở hữu thể gửi người, thỉnh thoảng được gọi là “người tậu sắm bí mật” tới những shop của đối thủ khó khăn để ghi chú về giá cả.

Trực tuyến, ko cần phải gửi người ở bất cứ đâu. Nhưng những nhà bán lẻ to sở hữu thể bán hàng triệu sản phẩm, vì vậy ko hợp lý lúc sở hữu viên chức duyệt từng mặt hàng và điều chỉnh giá thủ công. Thay vào đó, những doanh nghiệp sử dụng phần mềm để quét những trang web đối thủ và thu thập giá, một trật tự được gọi là “scraping”. Từ đó, những doanh nghiệp sở hữu thể tự điều chỉnh giá của mình.

Alexandr Galkin, Giám đốc quản lý của doanh nghiệp tối ưu hóa giá bán lẻ khó khăn Competara cho biết, những doanh nghiệp như Amazon và Walmart sở hữu những nhóm nội bộ chuyên nghiên cứu thu thập giá. Những người khác thì tìm tới những doanh nghiệp như của ông đó. Compertera thu thập thấp dữ liệu về giá từ khắp những trang web, từ những doanh nghiệp từ nhà bán lẻ giày dép Nine West cho tới nhà sản xuất công nghiệp Deelat và sử dụng những thuật toán học của máy để giúp khách hàng của mình quyết định tính phí bao nhiêu cho những sản phẩm khác nhau.

Walmart đã ko phản hồi yêu cầu phân bình luận. Amazon cũng đã ko trả lời những thắc mắc về việc liệu nó sở hữu thu thập dữ liệu từ những trang web khác hay ko. Nhưng những người sáng lập Diapers.com, được Amazon tậu lại vào năm hngười nào0một0, đã cáo buộc Amazon sử dụng những bot tương tự để tự động điều chỉnh giá của nó, theo cuốn sách The Everything Store của Brad Stone.

Việc dò quét thông tin sở hữu vẻ nham hiểm, nhưng nó là một phần trong nhữngh thức hoạt động của web. Google và Bing thu thập những trang web để lập chỉ mục cho những phương tiện tìm kiếm của họ. Các học giả và nhà báo sử dụng phần mềm quét thông tin để thu thập dữ liệu. Một số khách hàng của Competera, bao gồm Acer Châu Âu và Panasonic, sử dụng nhà sản xuất thương hiệu thông minh của doanh nghiệp trực tuyến để xem những gì những nhà bán lẻ đang tính phí cho sản phẩm của họ, để đảm bảo rằng họ đang tuân thủ những thỏa thuận về giá.

Đối với những nhà bán lẻ, việc dò quét thu thập thông tin sở hữu thể là một con dao hngười nào lưỡi, và đó là lúc lúc mà mọi thứ trở nên thú vị. Các nhà bán lẻ muốn xem đối thủ của họ đang làm gì, nhưng họ muốn ngăn chặn những đối thủ rình mò họ; những nhà bán lẻ cũng muốn bảo vệ tài sản trí tuệ như hình ảnh và mô tả sản phẩm, sở hữu thể được loại bỏ và tái sử dụng mà ko cần sự cho phép của người khác. Vì vậy, nhiều doanh nghiệp triển khngười nào phòng thủ để lật đổ cào, Josh Shaul, phó chủ toạ bảo mật web tại Akamngười nào Technologies nói. Một kỹ thuật: hiển thị giá khác nhau cho người thực so với bot. Một trang web sở hữu thể hiển thị giá là cao một  nhữngh ko tưởng hoặc bằng ko để ngăn cản bot khỏi thu thập dữ liệu.

Phòng thủ tương tự tạo ra thời cơ cho những phương pháp mới. Một doanh nghiệp sở hữu tên Luminati giúp khách hàng, bao gồm cả Competera, bot ẩn danh để tránh bị phát hiện. Một nhà sản xuất làm cho những bot nhịn nhường như tới từ điện thoại thông minh.

Dịch vụ Luminati, sở hữu thể giống với một botnet, một mạng lưới những máy tính chạy phần mềm độc hại mà tin tặc sử dụng để phát động những cuộc tiến công. Tuy nhiên, thay vì tình cờ tiếp quản một thiết bị, Luminati thu hút chủ sở hữu thiết bị chấp nhận phần mềm của nó cùng với một ứng dụng khác. Chẳng hạn, người tiêu dùng tải xuống MP3 Cutter từ Beka cho Android được lựa chọn: Xem quảng cáo hoặc cho phép ứng dụng sử dụng “một số tài nguyên trên thiết bị của khách hàng (WiFi và dữ liệu di động rất hạn chế). Nếu khách hàng đồng ý cho phép ứng dụng sử dụng tài nguyên của khách hàng, Luminati sẽ sử dụng điện thoại của khách hàng trong vài giây mỗi ngày lúc rảnh rỗi để định tuyến những yêu cầu từ bot của khách hàng và trả phí cho nhà sản xuất ứng dụng. Beka ko trả lời yêu cầu nhận xét.

Cuộc chiến bot và chuột đang diễn ra đặt ra một thắc mắc: Làm thế nào để khách hàng phát hiện ra bot? Điều đó khó khăn. Đôi lúc những bot thực sự nói với những trang web mà họ đang truy cập rằng họ là những bot. Khi một phần mềm truy cập vào một máy chủ web, nó sẽ gửi một ít thông tin cùng với yêu cầu của nó cho trang. Các trình duyệt thông thường tự công bố là Google Chrome, Microsoft Edge hoặc một trình duyệt khác. Bots sở hữu thể sử dụng trật tự này để nói với máy chủ rằng chúng là bot. Nhưng họ cũng sở hữu thể nói láo. Một kỹ thuật để phát hiện những bot là tần suất khách truy cập truy cập vào một trang web. Nếu một khách truy cập thực hiện hàng trăm yêu cầu mỗi phút, thì sở hữu khả năng đó là một bot. Một thực tế phvòng biến khác là xem xét một liên hệ giao thức internet của khách truy cập. Ví dụ, nếu nó xuất phát từ một nhà sản xuất điện toán đám mây, thì đó là một gợi ý rằng đó sở hữu thể là bot chứ ko phải người tiêu dùng internet thông thường.

Shaul nói rằng những kỹ thuật như ngụy trang lưu lượng bot đã làm cho cho nó sắp như vô dụng lúc phải dựa vào một liên hệ internet. Captchas sở hữu thể viện trợ, nhưng chúng tạo ra sự bất tiện cho người tiêu dùng hợp pháp. Vì vậy, Akamngười nào đang thử một mẫu gì đó khác nhau. Thay vì chỉ tìm kiếm những hành vi phvòng biến của bot, nó tìm kiếm những hành vi phvòng biến của con người và cho phép những người tiêu dùng đó vượt qua.

“Thực sự sở hữu rất nhiều tình huống khác nhau trong đó việc cạo được sử dụng trên internet là tốt, xấu hoặc ở đâu đó ở giữa.”

JOSH SHAUL, CÔNG NGHỆ AKAMAI

Khi khách hàng nhấn một nút trên điện thoại, khách hàng sẽ di chuyển điện thoại một tí. Chuyển động đó sở hữu thể được phát hiện bằng gia tốc kế và con quay hồi chuyển của điện thoại và gửi tới máy chủ của Akamngười nào. Sự hiện diện của dữ liệu chuyển động phút là một đầu mối mà người tiêu dùng là con người và sự vắng mặt của nó là một đầu mối mà người tiêu dùng sở hữu thể là một bot.

Giám đốc quản lý của Luminati, Ofer Vilenski nói rằng doanh nghiệp chưa đưa ra nhữngh nào để khắc phục vấn đề này, bởi vì đó là một thực tế tương đối hiếm gặp. Nhưng Shaul nghĩ rằng đó chỉ là vấn đề thời kì trước lúc những nhà sản xuất bot bắt kịp. Sau đó sẽ là thời kì cho một vòng đổi mới khác. Cuộc đua vũ trang bot trên internet cũng vậy.

Bots tốt và Bots xấu

Một thách thức to đối với Akamngười nào và những người khác đang nỗ lực quản lý lưu lượng liên quan tới bot là cần phải cho phép một số, nhưng ko phải tất cả, những bot để quét một trang web. Nếu những trang web chặn hoàn toàn bot, chúng sẽ ko hiển thị trong kết quả tìm kiếm. Các nhà bán lẻ thường muốn giá cả và những mặt hàng của họ xuất hiện trên những trang web so sánh tậu sắm như Google Mua sắm và Giá Grabber.

Shaul nói: “Thực sự sở hữu rất nhiều tình huống khác nhau trong đó việc dò quét thông tin được sử dụng trên internet là tốt, xấu hoặc chưa rõ tốt xấu”. “Chúng tôi sở hữu rất nhiều khách hàng tại Akamngười nào, những người đã tới với chúng tôi để giúp chúng tôi quản lý vấn đề chung của robot, thay vì con người, ghé thăm trang web của họ.”

Một số doanh nghiệp giúp thu thập thông tin từ những trang web riêng của họ. Andrew Fogg là người đồng sáng lập của một doanh nghiệp sở hữu tên là Import.io, chuyên sản xuất những phương tiện dựa trên web để cạo dữ liệu. Fogg cho biết một trong những khách hàng của Import.io là một nhà bán lẻ to sở hữu hngười nào hệ thống hàng tồn kho, một cho hoạt động kho và một cho trang thương nghiệp điện tử. Nhưng hngười nào hệ thống thường ko đồng bộ. Vì vậy, doanh nghiệp loại bỏ trang web riêng của mình để tìm kiếm sự khác biệt. Công ty sở hữu thể tích hợp cơ sở vật chất dữ liệu chặt chẽ hơn, nhưng việc thu thập dữ liệu sở hữu hiệu quả hơn về tầm giá, ít nhất là trong ngắn hạn.

Những phương tiện thu thập dò quét thông tin khác vẫn ko rõ là tốt hay xấu. Shaul  lđó nghình hàng ko là một ví dụ. Các trang web so sánh giá du lịch sở hữu thể kết nối doanh nghiệp tới những hãng hàng ko và những hãng hàng ko muốn những chuyến bay của họ hiển thị trong kết quả tìm kiếm cho những trang web đó. Nhưng nhiều hãng hàng ko phụ thuộc vào những doanh nghiệp bên ngoài như Amadeus IT và Saber để quản lý hệ thống đặt cọc của họ. Khi khách hàng tra cứu thông tin chuyến bay qua những hãng hàng ko đó, thỉnh thoảng hãng phải trả phí cho hệ thống đặt vé. Những khoản phí đó sở hữu thể tăng thêm nếu một số lượng to bot liên tục rà soát chỗ ngồi của hãng hàng ko và thông tin về giá

Shaul nói Akamngười nào giúp khắc phục vấn đề này cho một số khách hàng của hãng hàng ko bằng nhữngh hiển thị thông tin về bộ nhớ cache của bot, để những hãng hàng ko truy vấn những doanh nghiệp bên ngoài mỗi lúc bot rà soát giá cả và tính sẵn sàng. Các bot đã giành được những thông tin cập nhật nhất, nhưng họ sẽ nhận được dữ liệu mới một nhữngh hợp lý mà ko phải trả nhiều tiền cho những hãng hàng ko.

Tuy nhiên, lưu lượng truy cập khác rõ ràng là sở hữu vấn đề, chẳng hạn như những cuộc tiến công từ chối nhà sản xuất phân tán hoặc DDoS, nhằm mục đích áp đảo một trang web bằng nhữngh làm ngập lưu lượng truy cập. Amazon, là một ví dụ của việc ko chặn những bot hoàn toàn, bao gồm cả người quét dọn giá cả, người phát ngôn nói. Tuy nhiên, doanh nghiệp đã ưu tiên con người hơn bot lúc cần thiết để đảm bảo chúng tôi sản xuất trải nghiệm tậu sắm mà khách hàng mong đợi từ Amazon.

Fogg nói rằng Import.io ko bị chặn nhiều. Công ty nỗ lực trở thành một “công dân tốt” bằng nhữngh giữ cho phần mềm của họ ko tiến công máy chủ quá thường xuyên hoặc sử dụng nhiều tài nguyên.

Vilenski nói rằng khách hàng của Luminati sở hữu lý do chính đáng để giả vờ ko phải là bot. Ví dụ như một số nhà xuất bản muốn đảm bảo những nhà quảng cáo đang hiển thị một trang web xem người xem cùng một quảng cáo mà họ hiển thị cho nhà xuất bản.

Tuy nhiên, mô phỏng kinh doanh của doanh nghiệp đã gây chú ý vào năm hngười nào0một5 lúc một nhà sản xuất tương tự từ doanh nghiệp chị em của nó, Hola VPN, được sử dụng để phát động một cuộc tiến công DDoS trên trang web 8chan. Đầu tháng này, tiện ích mở rộng Hola VPN VPN Chrome đã bị cáo buộc sử dụng để đánh cắp mật khẩu của người tiêu dùng nhà sản xuất tiền điện tử MyEtherWallet. Trong một bài đăng trên blog, Hola VPN cho biết tài khoản Google Chrome Store của họ đã bị xâm phạm, cho phép kẻ tiến công thêm phần mềm độc hại vào tiện ích mở rộng của nó. Vilenski nói rằng doanh nghiệp đã kỹ càng rà soát khách hàng của mình, bao gồm một cuộc gọi video và những bước để xác minh tính danh khách hàng tiềm năng. Ông từ chối phân bình luận về việc sử dụng nhà sản xuất Luminati, bị cáo buộc là độc hại. Tranh cãi hay ko, Vilenski nói rằng hoạt động kinh doanh của doanh nghiệp đã tăng gấp ba lần trong năm qua.

 

News Reporter

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *