面對滿屏的文件和散落各處的數(shù)據(jù),日立的內(nèi)容智能解決方案正悄然改變企業(yè)處理信息的方式,讓整理資料從負擔(dān)變?yōu)閮?yōu)勢。
公司的非結(jié)構(gòu)化數(shù)據(jù)正以每年超過60%的速度增長-1。當(dāng)客戶找到日立咨詢解決方案時,他們的數(shù)據(jù)就像一間從未整理過的儲藏室,想要找一份文件可能需要翻遍整個數(shù)字倉庫。

日立數(shù)據(jù)系統(tǒng)公司推出的Content Intelligence(內(nèi)容智能解決方案),專門為解決這一問題而生,它能從企業(yè)存儲庫中提取數(shù)據(jù)和元數(shù)據(jù),對海量非結(jié)構(gòu)化數(shù)據(jù)執(zhí)行智能分析操作-1。

許多企業(yè)的數(shù)據(jù)存儲方式可謂是“八仙過海,各顯神通”,不同部門用不同系統(tǒng),各種格式的文件散落在本地硬盤、云存儲和郵件附件里。尋找特定文件時,往往需要詢問多人、翻找多個位置,效率極低。
這種數(shù)據(jù)孤島現(xiàn)象不僅影響工作效率,還可能引發(fā)合規(guī)風(fēng)險。日立內(nèi)容智能解決方案的產(chǎn)品營銷高級總監(jiān)Scott Baker指出:“我們真正需要的是一個能夠?qū)?shù)據(jù)理解到位的解決方案,基本理念就是打破數(shù)據(jù)孤島。”-1
傳統(tǒng)文件管理方式的最大問題是,它們只能基于文件名或簡單標簽進行,而無法理解文件內(nèi)容。當(dāng)需要查找“去年第三季度華東地區(qū)銷售合同”時,系統(tǒng)無法理解這些概念,只能依賴人工整理和記憶。
日立的Content Intelligence解決方案有一個聰明的大腦,它內(nèi)置在日立內(nèi)容產(chǎn)品組合的對象存儲中,基于Docker容器技術(shù)作為集群架構(gòu)開發(fā)-1。這個系統(tǒng)可以直接部署在企業(yè)的裸機系統(tǒng)、虛擬環(huán)境或公有云中,適應(yīng)不同的IT環(huán)境。
這個系統(tǒng)的核心能力是理解文件內(nèi)容而不僅僅是文件名。Baker解釋道:“Hitachi Content Intelligence能夠理解文檔,然后對其進行分類,例如zip文件或PDF或視頻文件。”-1
更厲害的是,系統(tǒng)可以對這些文件應(yīng)用不同類型的自定義數(shù)據(jù)分析,例如社會安全號碼的模式匹配或?qū)ふ也煌臄?shù)據(jù)格式-1。這意味著即使是掃描的圖片文檔,系統(tǒng)也能識別其中的關(guān)鍵信息并進行分類。
在數(shù)據(jù)管理領(lǐng)域,元數(shù)據(jù)被認為是長期數(shù)據(jù)管理的關(guān)鍵所在-1。日立內(nèi)容智能平臺的核心優(yōu)勢之一就是開發(fā)出良好的元數(shù)據(jù),并幫助客戶了解這些元數(shù)據(jù)如何有助于實現(xiàn)其業(yè)務(wù)和IT目標。
451研究公司存儲技術(shù)高級分析師Steven Hill指出:“元數(shù)據(jù)是或多或少包含數(shù)據(jù)本身詳細信息的數(shù)據(jù)庫條目,它可作為存儲環(huán)境的一部分與數(shù)據(jù)保存在一起。”-1
這些數(shù)據(jù)庫條目能夠以傳統(tǒng)文件和塊系統(tǒng)所不能實現(xiàn)的方法,建立用于處理數(shù)據(jù)的策略。元數(shù)據(jù)可以作為一個挖掘、管理和移動數(shù)據(jù)的工具,而不用考慮其所處位置-1。
日立的解決方案提供最多36種數(shù)據(jù)分析方法,并可創(chuàng)建元數(shù)據(jù)的自定義子集以供模式匹配使用-1。客戶可以為特定數(shù)據(jù)集編寫自定義屬性,或者從合規(guī)性或醫(yī)療記錄等特定數(shù)據(jù)源中提取有用信息。
日立這套系統(tǒng)的設(shè)計理念是將復(fù)雜的技術(shù)藏在后臺,給用戶提供簡單直觀的操作界面。用戶可以通過拖放操作設(shè)計工作流程,系統(tǒng)甚至允許進行測試來明確流程管道是如何影響索引末尾或遷移的相關(guān)關(guān)聯(lián)文檔的-1。
Baker詳細描述了這一過程:“一旦用戶定義了連接器,之后工作流就可被設(shè)計為一個拖放的操作。這種設(shè)計可允許用戶查看可定義產(chǎn)生一般結(jié)果的過程。”-1
對于IT管理員而言,這個軟件工具允許他們進行測試,以確保根據(jù)特定查詢提取和載入內(nèi)容的正確性-1。這種設(shè)計既保證了系統(tǒng)的強大功能,又降低了使用門檻,讓非技術(shù)背景的員工也能充分利用數(shù)據(jù)價值。
在實際應(yīng)用中,日立的內(nèi)容智能解決方案已經(jīng)幫助許多企業(yè)解決了具體問題。日立內(nèi)容平臺(HCP)與內(nèi)容智能解決方案結(jié)合,為企業(yè)提供數(shù)據(jù)分析、實時內(nèi)容分析及企業(yè)功能,幫助它們揭露洞察力、提高生產(chǎn)力及降低風(fēng)險-7。
在合規(guī)管理方面,日立的解決方案表現(xiàn)出色。系統(tǒng)可以自動發(fā)現(xiàn)和預(yù)測數(shù)據(jù)隱私及合規(guī)需求,通過集中化存儲并高度自動化,幫助企業(yè)將合規(guī)成本縮減高達67%-7。
對于金融、媒體、娛樂和政府等行業(yè),日立提供針對性的解決方案。例如,金融服務(wù)業(yè)可以利用HCP滿足證券業(yè)合規(guī)要求;媒體與娛樂公司則能利用現(xiàn)代化、邊緣到云端的檔案服務(wù)提高生產(chǎn)力并節(jié)省成本-7。
當(dāng)企業(yè)詢問“日立怎么樣”時,他們真正想知道的是日立能否解決自己的數(shù)據(jù)管理難題。日立的答案是提供一套能夠?qū)⒎稚?shù)據(jù)轉(zhuǎn)化為有價值業(yè)務(wù)信息的系統(tǒng)。
日立內(nèi)容智能平臺的引擎允許用戶根據(jù)查詢操作提取信息,從而挑選出有待進入傳輸和載入過程而需排序的文件-1。這一功能特別適合需要處理大量文檔的法律、醫(yī)療和研究機構(gòu)。
從技術(shù)架構(gòu)來看,這套系統(tǒng)需要64位版Linux、Docker 1.10版的支持,是基于開源集群管理器Apache Mesos設(shè)計的-1。這種開放的技術(shù)選擇保證了系統(tǒng)的可擴展性和兼容性。
企業(yè)采用日立解決方案后,不僅能夠更有效地管理現(xiàn)有數(shù)據(jù),還能為未來數(shù)據(jù)增長做好準備。系統(tǒng)可以連接到各種數(shù)據(jù)源,包括亞馬遜S3(簡單存儲服務(wù))或微軟Azure或文件系統(tǒng)-1,形成統(tǒng)一的數(shù)據(jù)視圖。
日立建機的EX1900-6液壓挖掘機在2024年全球工程機械峰會上榮獲“礦山設(shè)備年度產(chǎn)品獎”,工作質(zhì)量高達190噸,能夠在惡劣礦山環(huán)境中持續(xù)作業(yè)-6。 而在完全不同的領(lǐng)域,日立冷氣連續(xù)24年獲得《讀者文摘》信譽品牌白金獎,其空調(diào)產(chǎn)品能實現(xiàn)±0.5℃的精準溫控-2-4。
從礦山機械到家庭空調(diào),從數(shù)據(jù)管理到智能制造,這家企業(yè)的技術(shù)已經(jīng)像毛細血管般滲透到現(xiàn)代社會的各個角落,卻始終保持著一以貫之的品質(zhì)追求。