㈠ 如何完整抓取大眾點評網數據
用前嗅的ForeSpider數據採集工具,可以完整採集大眾點評網的數據。軟體可以抽取出所有的鏈接地址,通過url或標題特徵,過濾掉無關的鏈接地址。對於數據結果,通過可視化的配置,可以完整的採集所有的公開可見內容。軟體自帶免費的千萬級資料庫,數據採集入庫可以自動排重、清洗和處理。並且可以數據挖掘,挖掘各種不規則的信息。可以下載免費版試一試。
下面是軟體的特點:
一.強大:可以抓取互聯網上100 %的公開數據
1.內置強大數據挖掘功能。
2.支持用戶登錄。
3.支持Cookie技術。
4.支持驗證碼識別。
5.支持HTTPS安全協議。
6.支持OAuth認證。
7.支持POST請求。
8.支持搜索欄的關鍵詞搜索採集。
9.支持JS動態生成頁面採集。
10.支持IP代理採集。
11.支持圖片採集。
12.支持本地目錄採集。
13.內置面向對象的腳本語言系統,配置腳本可以採集幾乎100%的互聯網公開數據。
二.可視化+爬蟲腳本語言+正則表達式
ForeSpider是可視化的通用性採集軟體,同時內置了強大的爬蟲腳本語言。如果有通過可視化採集不到的內容,都可以通過簡單幾行代碼,實現強大的腳本採集。軟體同時支持正則表達式操作,可以通過可視化、正則、腳本任意方式,實現對數據的清洗、規范。
三.集成數據挖掘功能
軟體內部集成了數據挖掘功能,可以通過一個採集模板,精準挖掘全網的內容。在數據採集入庫的同時,可以完成分類、統計、自然語言處理等諸多功能。
軟體與公司的ForeAna數據分析系統對接,可以實現強大的數據分析功能,對數據進行深度的大數據分析。
四.精準:精準採集所需數據
1.獨立知識產權JS引擎,精準採集。
2.內部集成資料庫,數據直接採集入庫。
3.內部創建數據表結構,抓取數據後直接存入資料庫相應欄位。
4.根據dom結構自動過濾無關信息。
5.通過模板配置鏈接抽取和數據抽取,目標網站的所有可見內容均可採集,智能過濾無關信息。
6.採集前數據可預覽採集,隨時調整模板配置,提升數據精度和質量。
7.欄位的數據支持多種處理方式。
8.支持正則表達式,精準處理數據。
9.支持腳本配置,精確處理欄位的數據。
五.高性能:千萬級的採集速度
1.C++編寫的爬蟲,具備絕佳採集性能。
2.支持多線程採集。
3.台式機單機採集能力可達4000-8000萬,日採集能力超過500萬。
4.伺服器單機採集能力可達8億-16億,日採集能力超過4000萬。
5.並行情況下可支撐百億以上規模數據鏈接,堪與網路等搜索引擎系統媲美。
6.軟體性能穩健,穩定性好。
六.簡易高效:節約70%的配置時間
1.完全可視化的配置界面,操作流程順暢簡易。
2.基本不需要計算機基礎,代碼薄弱人員也可快速上手,降低操作門檻,節省企業爬蟲工程師成本。
3.過濾採集入庫一步到位,集成表結構配置、鏈接過濾、欄位取值、採集預覽、數據入庫。
4.數據智能排重。
5.內置瀏覽器,欄位取值直接在瀏覽器上可視化定位。
五.數據管理:數據智能入庫
1.數據存儲在用戶本地計算機,不會上傳至前嗅伺服器,保證數據獨有,更加安全。
2.內置資料庫,數據採集完畢直接存儲入庫。
3.在軟體內部創建數據表和數據欄位,直接關聯資料庫。
4.採集數據時配置數據模板,網頁數據直接存入對應數據表的相應欄位。
5.正式採集之前預覽採集結果,有問題及時修正配置。
6.數據表可導出為csv格式,在Excel工作表中瀏覽。
7.數據可智能排除,二次清洗過濾。
六.智能:智能模擬用戶和瀏覽器行為
1.智能模擬瀏覽器和用戶行為,突破反爬蟲限制。
2.自動抓取網頁的各類參數和下載過程的各類參數。
3.支持動態IP代理加速,智能過濾無效IP代理,提升代理的利用效率和採集質量。
4.支持動態調整數據抓取策略,多種策略讓您的數據無需重采,不再擔心漏采,數據採集更智能。
5.自動定時採集。
6.設置採集任務條數,自動停止採集。
7.設置文件大小閾值,自動過濾超大文件。
8.自由設置瀏覽器是否加速,自動過濾頁面的flash等無關內容。
9.智能定位欄位取值區域。
10.可以根據字元串特徵自動定位取值區域。
11.智能識別表格的多值,表格數據可以完美存入相應欄位。
七.增值服務
1.VIP客服持續在線服務,解決各類技術難題,可以遠程幫助完成配置。
2.提供大量免費的採集模板,用戶可以下載導入。
3.軟體被防爬後,免費提供解決方案和軟體的針對性升級。
4.免費升級後續不斷開發的更多功能。
5.軟體綁定賬號不固定計算機,可以任意更換使用的計算機。
6.為用戶提供各類高端定製化服務,全方位來滿足用戶的數據需求。
長達8個月之久的瓊瑤、於正著作權糾紛案,昨天有了結論。市三中院一審判決於正等五被告連帶賠償瓊瑤500萬元、刊登致歉聲明,並停止傳播、發行和復制《宮鎖連城》。
宣判後,瓊瑤激動不已,發微博稱「淚在眼眶」、「只想大喊一句,知識產權勝利了」。於正則對判決結果表示遺憾,並將提起上訴。
看點
1、瓊瑤是否有權告?
庭審中,於正等五被告都就著作權一事質疑瓊瑤方,提出瓊瑤並非《梅花烙》編劇,該電視劇版的編劇署名為林久愉,瓊瑤僅是編劇指導而非作者。對此,瓊瑤方反駁並遞交編劇林久愉的聲明予以證明。
法院審理後認為,電視劇《梅花烙》字幕雖有「編劇林久愉」的署名,但林久愉本人出具的《聲明書》,已明確表示其並不享有劇本《梅花烙》著作權的事實;電視劇《梅花烙》製片者怡人傳播有限公司出具的《著作權確認書》也已明確表述劇本《梅花烙》的作者及著作權人均為瓊瑤。
而林久愉根據瓊瑤口述整理劇本《梅花烙》,是一種記錄性質的執筆操作,並非著作權法意義上的整理行為或融入獨創智慧的合作創作活動,所以林久愉並不是劇本《梅花烙》作者。所以《梅花烙》的作者及著作權人均為瓊瑤。
2、於正到底抄沒抄?
於正是否抄襲是庭審中爭論的焦點,也是本次判決中最大的看點。
4月15日,瓊瑤在微博貼出了一封寫給廣電總局領導的舉報信,稱自己作品《梅花烙》被於正編劇的《宮鎖連城》抄襲,並一一列舉其抄襲的幾個部分。12月5日開庭時,瓊瑤方還列舉了21個橋段涉及抄襲,並當庭播放了節選。
相對的,於正曾在微博發文回應,稱這只是「一次巧合和誤傷」。在11月16日的一個討論會上,於正曾表示,瓊瑤指證他抄襲的情節,實際是來自於《紅樓夢》。在12月5日的庭審上,於正方稱《宮鎖連城》和《梅花烙》在人物數量和人物關繫上存在實質性區別。
法院經過審理指出,21個橋段中有3個橋段屬於公知素材,相關情節安排不具有顯著獨創性,因而不受著作權法保護。有9個橋段屬於公知素材,瓊瑤就這些素材進行了獨創性的藝術加工,以使情節本身具有獨創性,但劇本《宮鎖連城》與這些獨創設置不構成實質相似。剩餘9個橋段,為瓊瑤作品中的獨創情節,劇本《宮鎖連城》中的對應情節安排與這些橋段構成實質性相似關聯。由此,認定於正侵權。
3、到底應該賠多少?
瓊瑤的訴狀中,被告不僅有於正,還包括了湖南經視文化傳播有限公司、東陽歡娛影視文化有限公司、萬達影視傳媒有限公司、東陽星瑞影視文化傳媒有限公司。瓊瑤方表示,除電視台予以播出以外,《宮鎖連城》還登陸了國內多家知名網路電視終端,已形成穩定收益,據此索賠2000萬。
但於正方並不認同,認為瓊瑤方面「濫用訴權,漫天要價,且通過個人身份、年齡、媒介片面進行輿論渲染」,並懇請法院駁回瓊瑤訴訟請求。
法院在認定於正存在侵權行為的基礎上指出,推定瓊瑤在庭審中主張的於正編劇酬金標准及《宮鎖連城》劇的發行價格具有可參考性。但瓊瑤關於賠償經濟損失及訴訟合理支出的訴訟請求,缺乏充分的依據。因此,根據涉案作品的性質、類型、影響力、被告侵權使用的情況、侵權作品播出使用的范圍以及被告方獲利情況和瓊瑤為本案支出的律師費、公證費等因素綜合考慮,判令於正及四家公司連帶賠償瓊瑤500萬元。
聲音
瓊瑤方 知識產權勝利了
昨天下午,案件剛剛宣判,瓊瑤就通過「花非花霧非霧官方微博」發聲。
瓊瑤在微博中寫道:「正義終於發出了聲音!謝謝三中院,謝謝宋魚水法官,馮剛法官、張玲玲法官,謝謝內地的法律,讓我對人生恢復了信心!此時此刻,激動不已,這個案子已經不是我和於正的個人爭議,而是『是』與『非』之爭,是『正義』與『非正義』之爭!淚在眼眶,我只想大聲喊一句,知識產權勝利了!」
隨後不久,瓊瑤又借用中國電影文學學會會長王興東的話表示,「瓊瑤訴於正一案,比他們創作一部劇本更具有深遠的影響力」,稱此是這場官司最正確的評價。瓊瑤還預告自己將在下周一發布長微博,「談談我的心情和一切」。
瓊瑤代理律師王軍表示,從5月立案到宣判的8個月時間里,瓊瑤本人經歷了很大的精神煎熬,判決符合瓊瑤的預期,也尊重了事實。
於正方曾談和解,要上訴
於正則通過於正工作室發表了對判決的觀點,稱「於正與其他四方被告的合理訴求沒有得到支持,對此表示遺憾。我們認為:一審判決認定事實不清,證據不足,適用法律不當。因此,將依法提起上訴,維護合法權益,並期待法律公平公正的裁決」。
王軍律師透露,於正曾私下向瓊瑤求和解,但並未讓人看到誠意。記者為此向負責處理此次訴訟事宜的公關公司負責人劉先生求證。對方表示,的確有過和解,但是不是與瓊瑤律師談和解。於正和解談的是對瓊瑤的敬意,不是歉意。
開庭時,王軍曾提出,於正擔任編劇的單集稿酬達20萬,《宮鎖連城》播放60多集,於正本人收益超過1000萬。各電視台播放許可費過億。對此,劉先生表示,收益問題不太好回答。
眾編劇版權保護拉開帷幕
瓊瑤訴於正侵權案勝訴後,大陸眾多編劇通過微博發聲,支持瓊瑤。
編劇汪海林發微博稱,「我代表中國電影文學學會,表達對北京市三中院就於正《宮鎖連城》侵權一案的判決的支持和肯定。裁決體現了尊重原創、保護原創的法律精神,這一裁決打擊了抄襲剽竊非法改編的行為,是法制的勝利,體現了陽光下的公正」。
此外,《蝸居》《心術》等電視劇的編劇六六也發微博表示:「終於!中國版權保護拉開帷幕。」
相似橋段
瓊瑤起訴列舉了21個橋段,指證於正《宮鎖連城》侵權,包括偷龍轉鳳、次子告狀親信遭殃、皇上賜婚多日不圓房、面聖陳情、公主求和遭誤解等。最終法院認定其中9個橋段與《梅花烙》構成實質性相似關聯。
被認定實質性相似關聯的橋段舉例:
1.偷龍轉鳳。《梅花烙》中,福晉倩柔為保住地位,用女兒換來一個男孩,取名皓禎,當做自己的兒子。而換出去的女兒被取名白吟霜。《宮鎖連城》中,王琳飾演的福晉無子,為保住地位,用女兒換來一個男孩,取名富察恆泰,被換出去的女兒被取名宋連城。
2.公主下嫁。《梅花烙》中,皓禎被皇帝許配了蘭公主。《宮鎖連城》中,富察恆泰被皇帝許配了醒黛和碩公主。
專家說法
500萬賠償並不算高
昨天晚上,記者就此案采訪了北京市中聞律師事務所資深知識產權法律師許紅亮,他曾代理很多知識產權類案件。
據許紅亮分析,知識產權類案件,並無明確統一的賠償標准。確定此類案件的賠償數額,考慮的因素遠比一般民商事案件復雜。以本案為例,一旦認定於正等多方侵權,確定賠償數額時,就要綜合考慮涉案劇的收益、傳播度和影響力等因素。法院的判決里已經提及這些因素,確定500萬的數額也是綜合考慮了這些因素。500萬的賠償數額雖然絕對數字比較大,但在知產類案件里並不大。特別是《宮鎖連城》這部劇,傳播范圍廣泛,收視率高,在觀眾中的影響力大,其收益肯定也遠遠大於500萬元。由於此類案件在具體的法律里沒有統一和明確的補償標准,因此沒法說500萬元是否是頂格判處。
許紅亮說,從判決的意義而言,雖然於正一方已經上訴,判決還沒有生效,但該案也具有標桿性意義,雙方都是家喻戶曉的編劇,其作品也具有極高關注度,該案體現了對著作權這一知識產權的尊重,對抄襲行為進行了打擊和警示,有助於形成尊重原創的良好氛圍。
(來源:京華時報)
㈢ 日本戰國時期國名
日本戰國歷史可與中國戰國相比擬。各地大名林立,為爭奪霸權攻伐不休。而且也是「無義戰」。 其間人名地名繁多,大戰小戰難以數計。不過,從地區劃分講也許更 容易了解其中形勢。
現在的日本可分為四部分:由西南向東北依次為九州,四國,本州和 北海道。戰國時的九州,四國與現在所稱相差不大。北海道則因其地處偏遠,戰國史中少有涉及。而本州則是四方征伐的中心。以京都為中心。當時的本州共分為中國,近畿,東海,北陸,關東,東北六個地區。 近畿以當時國都京都為中心,包括京都,奈良以及以後豐臣的大坂。其西部與中國地區相鄰。近畿地區東部南與東海地區(後來的織田信長憑借這個有利條件,控制京都,挾天子以令諸侯)為鄰,北與北陸地區接壤。 東海,北陸東與關東地區為鄰。而關東與北陸又東鄰東北地區。 室町幕府統治一百多年後開始衰落。各地強有力的大名紛紛自立為政。一般以 1467年(應仁元年)為日本戰國的起始到1615年德川家康發動大坂夏之戰,攻滅豐臣秀賴統一日本為止共148年的歷史。
戰國前期的大戰多集中與中國地區與京畿地區。一般是傳統意義上控制京畿的戰爭。參與者多為近畿地區而且在京都有相當勢力的大名。 從十六世紀初北條家爭奪關東霸權開始戰爭中心東移至東海關東,北陸地區。而這一時期也是日本戰國人材輩出的時代。其中以關東的北條氏康,越後(屬北陸地區)的上杉謙信,甲斐(東海地區)的武田信玄之間為爭奪關東,信濃等地的霸權的戰爭為代表。而東海地區因為有甲斐的武田信玄,尾張的織田信長和後來統一日本的三河德川家康而成為戰國時期的英才發源地。武田信玄經過多年戰爭擊敗苦主上杉謙信及北條今川等大名奪取駿河信濃等地,成為當時最強的大名。後來武田受沒落將軍足立義昭之命進軍京都,途中在三方原一戰(1572年)大敗德川家康,令織田信長坐立不安。但其後因病突然撤軍,功敗垂成。信玄死後,其子勝賴才具不足,長滌之戰敗於織田德川聯軍。甲斐從此走向衰落。武田死後不久,其死敵上杉謙信也病死。至此,戰國的重心轉向織田一系。織田信長是日本戰國時期的大名(諸侯)之一,與武田信玄,德川家康一時瑜亮,一生傳奇頗多。
在狹桶間合戰中,他在暴雨中高唱著「人間五十年,宛如夢幻,天下之內,豈有長生不滅者」 以四千兵馬奇襲今川義元的四萬軍隊,並砍下今川的首級。他也是第一位在日本史上大量運用火器的領主,在長筱一站中,用鐵柵欄後的三千鐵槍擊潰武田家號稱無敵的五萬鐵騎兵。織田與德川家康結成同盟,史稱「清州同盟,」統一 尾張、美濃後把主城從清州城移至美濃稻葉山城,並將稻葉山城 改名為「岐阜」城,取周文王鳳鳴岐山,一統天下之意。而後開始推行「天下布武」的策略,要以武力統一全國。在滅掉越前朝倉氏、近江淺井氏並流放足利義昭(幕府),擊敗毛利水軍之後,完全控制了中部。正當義氣飛揚的他准備攻打西部的毛利時,他的大將明智光秀,因憎恨信長斬首武田人質而迫使武田殺了光秀的母親,也因為不堪信長的羞辱和猜忌,起義包圍了他下宿的本能寺,信長不願被擒,於是自焚而死。信長被人認為是明君,也是魔鬼。他有溫和大度的一面,也有常人無法理解的殘忍奸惡的另一面。這個自稱為「第六天魔王」的人給後世留下了多少的憎惡和嚮往。
信長的時代是日本崇尚中國文明的時代,也是日本開始引入西方技術的時代。武田家出了熟讀孫子兵法的信玄,高舉著的「風林火山」(來自孫子兵法的疾如風,靜如林,侵掠如火,不動如山)而他終身的對手信長卻是熱衷西洋文化,購置火槍鐵炮,和用鐵甲船來對付他的敵人。相傳他一度身穿和服,卻批著西班牙海軍的斗蓬戴著羽毛帽招搖過市。 我們也許可以從當時的詳細記錄的禮儀和戰史中體會到不少讓國人感嘆和共鳴的感受吧。 織田信長在武田信玄死後立即消滅忠於足利氏的淺井朝倉兩大名,接著放逐足利義昭。室町幕府至此終結。
此後,織田擊敗武田軍並且逐漸控制近畿,東海地區,成為日本實際的掌權者。接著織田信長派羽柴秀吉進攻中國地區最強的大名毛利輝元。雙方在相持階段時突然傳來織田大將明智光秀火燒本能寺(1582年),織田信長死難的消息。 織田信長築安土城自居,故其統治時期被稱為安土時代。 羽柴秀吉立即與毛利輝元議和,回師平叛。其後,羽柴秀吉擊敗柴田勝家(1582)。次年在小牧長久手之戰後與德川家康議和,鞏固了他對近畿,東海地區的統治。在後來的四國征伐,九州征伐後基本統一日本南部。
1590年,豐臣秀吉發動小田原之戰,攻滅北條氏政,統一關東地區。為鎮撫關東各大名的勢力,豐臣秀吉將德川家康改封到關東。為後來德川稱雄埋下伏筆。同年,豐臣秀吉擊敗伊達政宗等奧州諸大名聯軍,征服東北地區。至此,日本統一。
為實現其定都北京的野心。1592年豐臣秀吉下令侵朝。明派軍隊援助朝鮮。 經五年戰爭後,形勢逐漸對日軍不利。1598年,豐臣秀吉病死,遺命從朝鮮撤軍。 豐臣秀吉築大坂城。其統治時期稱為桃山時代。 豐臣秀吉死後,其家臣分裂為近江,尾張兩派。一直韜光養晦的德川家康乘機聯合尾張一派,在關原之戰(1600年)中消滅西軍,豐臣一系勢力大衰。
德川稱雄日本並於1603年受封征夷大將軍,開始了江戶幕府統治。 為最終奠定德川家長久統治的基礎,德川家康在自己死前兩年內發動大坂冬和大坂夏之戰。 大坂夏之戰(1615年)中德川軍攻陷大坂,豐臣秀吉之子豐臣秀賴自殺身死。忠於豐臣的家老武士幾乎全部戰死。顯赫一時的豐臣家被消滅。 德川受封江戶(現東京),其政權稱江戶幕府。 至此,日本最終統一。戰國時代結束,進入江戶幕府時代。