發(fā)布時間 : 2010-08-23 17:08:01 來源 : 金站網(wǎng) 瀏覽次數(shù) :
南都訊 據(jù)《北京晚報》報道 目前,新浪、搜狐、網(wǎng)易、騰訊、人民網(wǎng)等各家網(wǎng)站都有微博。搜狐網(wǎng)監(jiān)控中心負責人王國欣告訴記者,包括微博、博客在內(nèi)的網(wǎng)民互動式互聯(lián)網(wǎng)產(chǎn)品,文字帖一般采用1000多個敏感詞進行過濾,如果其中含有敏感詞就直接刪除。這些敏感詞主要是涉槍、涉黃、涉暴的內(nèi)容。
據(jù)悉,微博被過濾掉的內(nèi)容,絕大多數(shù)是涉黃,另外就是發(fā)帖做廣告,或者是用語言攻擊其他人。王國欣說,搜狐微博是24小時都有人做過濾監(jiān)控,微博每天出現(xiàn)的七八萬個帖子,過濾掉的大約有5000多個。在搜狐社區(qū)每天出現(xiàn)的20多萬個帖子中,有4萬多個會被過濾掉。
除了文字要進行過濾監(jiān)控,圖片過濾也是互聯(lián)網(wǎng)監(jiān)控的一個重要內(nèi)容。王國欣稱,搜狐對網(wǎng)民在搜狐社區(qū)上傳的圖片采取軟件自動過濾加人工審核的方法,搜狐使用的軟件名為圖片過濾器,能通過膚色、紋理、動作、人臉等多個參數(shù),對圖片進行要素的提取。“人的膚色介于紅黃之間,當膚色大于一張圖片面積的40%,圖片就基本認定為情色圖片,進入人工審核程序。”獅子的皮毛是黃顏色,這樣的圖片會不會直接過濾掉呢?對于這樣的疑問,王國欣說,圖片過濾的一個選項是紋理,通過軟件可以發(fā)現(xiàn)獅子的邊緣很雜亂,與人體圖片的邊緣不同,不會被過濾掉。
記者在搜狐公司看到,一位負責網(wǎng)絡監(jiān)控的員工正在進行圖片的人工審核。網(wǎng)民上傳的照片按照每行5張、每屏40行的標準顯示在電腦屏幕上。當發(fā)現(xiàn)照片有露點、挑逗動作內(nèi)容時,他就會在圖片下面的方框內(nèi)點一下,圖片就不會上傳到網(wǎng)上公開發(fā)表了。