網(wǎng)絡(luò)爬蟲,一個陌生又熟悉的詞匯,畢竟你每一個字都認(rèn)識,可要是合起來那就是一張新面孔了。但是,如果我告訴你,你所熟悉的搜索引擎,如谷歌、百度、搜狗等,都有一個“傳家之寶”——網(wǎng)絡(luò)爬蟲,你會不會覺得親切一點?
★
網(wǎng)絡(luò)爬蟲,是互聯(lián)網(wǎng)時代被普遍運用的一項網(wǎng)絡(luò)信息搜集技術(shù)。該項技術(shù)最早應(yīng)用于搜索引擎領(lǐng)域,是搜索引擎獲取數(shù)據(jù)來源的支撐性技術(shù)之一。
爬蟲就是一個探測機(jī)器,它的基本操作就是模擬人的行為去各個網(wǎng)站溜達(dá),點點按鈕,查查數(shù)據(jù),或者把看到的信息背回來。簡單來說,它包含三個步驟:采集信息、數(shù)據(jù)存儲和信息提取。
然而,網(wǎng)絡(luò)爬蟲技術(shù)就好比一把雙刃劍,它們善惡不同,各懷心思。越是每個人切身利益所在的地方,就越是爬滿了爬蟲。對爬蟲技術(shù)應(yīng)用不當(dāng)?shù)钠髽I(yè),則有可能觸及相關(guān)法律法規(guī),獲得警察蜀黍贈送“銀手鐲”一副。
★
2021年11月8日,杭州網(wǎng)警接報案稱其企業(yè)信息查詢平臺數(shù)據(jù)被他人使用爬蟲非法獲取,造成損失。
網(wǎng)警部門對相關(guān)線索進(jìn)行研判擴(kuò)線,最終查清一以聶某為首的利用爬蟲非法獲取他人數(shù)據(jù)的犯罪團(tuán)伙,該團(tuán)伙嫌疑人通過編寫爬蟲腳本,利用爬蟲軟件爬取企業(yè)的各類數(shù)據(jù),將數(shù)據(jù)倒賣后獲利。
2月中旬,民警根據(jù)前期研判信息,鎖定嫌疑人并開展抓捕,成功抓獲三名嫌疑人,依法對三人進(jìn)行刑事傳喚,現(xiàn)已采取刑事強制措施?,F(xiàn)場勘驗查獲爬蟲腳本30余份,非法獲取數(shù)據(jù)2億余條,涉及企業(yè)2000余萬家。
在上述案例中 ,聶某為首的犯罪團(tuán)伙利用爬蟲非法獲取他人數(shù)據(jù),涉嫌非法獲取計算機(jī)信息系統(tǒng)數(shù)據(jù)罪。
而企業(yè)若在爬取數(shù)據(jù)時,存在危害計算機(jī)信息系統(tǒng)安全的行為,包括破解被爬企業(yè)的防抓取措施、加密算法、技術(shù)保護(hù)措施等,則很有可能被認(rèn)定為“侵入或以其他技術(shù)手段獲取計算機(jī)信息系統(tǒng)數(shù)據(jù)”。
什么是“非法獲取計算機(jī)信息系統(tǒng)數(shù)據(jù)罪”?
根據(jù)《中華人民共和國刑法》第二百八十五條規(guī)定,非法獲取計算機(jī)信息系統(tǒng)數(shù)據(jù)、非法控制計算機(jī)信息系統(tǒng)罪,是指違反國家規(guī)定,侵入國家事務(wù)、國防建設(shè)、尖端科學(xué)技術(shù)領(lǐng)域以外的計算機(jī)信息系統(tǒng)或者采用其他技術(shù)手段,獲取該計算機(jī)信息系統(tǒng)中存儲、處理或者傳輸?shù)臄?shù)據(jù),情節(jié)嚴(yán)重的行為。刑法第285條第2款明確規(guī)定,犯本罪的,處三年以下有期徒刑或者拘役,并處或者單處罰金;情節(jié)特別嚴(yán)重的,處三年以上七年以下有期徒刑,并處罰金。
現(xiàn)如今,互聯(lián)網(wǎng)成了海量信息的載體,數(shù)據(jù)采集以及分析能力已成為驅(qū)動業(yè)務(wù)決策的關(guān)鍵技能,網(wǎng)絡(luò)爬蟲技術(shù)則成為這個時代不可或缺的一部分。但是如若使用爬蟲技術(shù)應(yīng)用不當(dāng),相關(guān)的企業(yè)公司除了會涉及非法獲取計算機(jī)信息系統(tǒng)數(shù)據(jù)罪外,還有可能涉及以下兩個罪名:
一、侵犯公民個人信息罪
公民個人信息,是指以電子或者其他方式記錄的,能夠單獨或者與其他信息結(jié)合識別特定自然人身份,或者反映特定自然人活動情況的各種信息,包括姓名、身份證件號碼、通信通訊聯(lián)系方式、住址、賬號密碼、財產(chǎn)狀況、行蹤軌跡等。利用爬蟲技術(shù)收集公民個人信息數(shù)據(jù),應(yīng)當(dāng)獲得被收集人的同意,尤其是在數(shù)據(jù)中包含身份證號、信用信息等敏感數(shù)據(jù)的情況下,還需要獲得明示同意。同時,利用網(wǎng)絡(luò)漏洞非法下載、非法購買等行為,都屬于“非法獲取”公民個人信息。
二、非法侵入計算機(jī)信息系統(tǒng)罪
非法侵入計算機(jī)信息系統(tǒng)罪,是指自然人或者單位違反國家規(guī)定,侵入國家事務(wù)國防建設(shè)、尖端科學(xué)技術(shù)領(lǐng)域的計算機(jī)信息系統(tǒng)的行為。即使進(jìn)入非國家事務(wù)、國防建設(shè)、尖端科學(xué)技術(shù)領(lǐng)域的計算機(jī)信息系統(tǒng)而未抓取數(shù)據(jù),但如果網(wǎng)絡(luò)爬蟲過快或大量重復(fù)訪問,進(jìn)而干擾了信息系統(tǒng)正常運行,后果嚴(yán)重的也可能構(gòu)成破壞計算機(jī)信息系統(tǒng)罪。
大數(shù)據(jù)時代,網(wǎng)絡(luò)爬蟲已成為互聯(lián)網(wǎng)抓取公開數(shù)據(jù)的常用工具之一,可以實現(xiàn)對文本、圖片、音頻、視頻等互聯(lián)網(wǎng)信息的海量抓取。但實踐中,技術(shù)的高效與便利性使得網(wǎng)絡(luò)爬蟲技術(shù)存在被濫用的現(xiàn)象,這在一定程度上可能產(chǎn)生侵害他人數(shù)據(jù)信息安全的法律風(fēng)險。
互聯(lián)網(wǎng)并非法外之地,對于利用“網(wǎng)絡(luò)爬蟲”技術(shù)爬取的企業(yè)而言,如何在合法合規(guī)的前提下開展數(shù)據(jù)爬取業(yè)務(wù),將是一個值得長期思考的主題。
2022年是公安部在全國部署開展“凈網(wǎng)”專項行動的第五個年頭。杭州網(wǎng)警在這場集中整治網(wǎng)絡(luò)環(huán)境、凈化網(wǎng)絡(luò)空間的阻擊戰(zhàn)、攻堅戰(zhàn)中,取得了亮麗的工作成績,也獲得了廣大網(wǎng)民的肯定支持。
記者:康樂/通訊員:章志楠
掃描二維碼推送至手機(jī)訪問。
版權(quán)聲明:本文由信途科技轉(zhuǎn)載于網(wǎng)絡(luò),如有侵權(quán)聯(lián)系站長刪除。
轉(zhuǎn)載請注明出處http://macbookprostickers.com/xintu/61647.html