2016年,人工智能技術被推上了研究和商業的風口浪尖,
從“深藍” 到Master,從駕駛輔助到自動駕駛,從Alexa到Google
Home,從大學教授到企業領袖,人工智能技術在互聯網行業遍地開花,同時也對人們心目中的傳統行業--制造業帶來了巨大的沖擊與商機。
從“深藍”到Master
繼IBM“深藍”在國際象棋對決中戰勝世界冠軍卡斯帕羅夫,Waston在危機邊緣戰勝人類冠軍Ken和Brad,Eugene挑戰圖靈的“TheImitation
Game”后,人工智能在一個更加復雜的領域—圍棋中再次超過了人類的最高水平,AlphaGo以4:1的比分戰勝了韓國圍棋大師李世乭,其升級版Master更是在弈城網上取得60:0:1的不敗戰績。同樣是在對弈比賽中戰勝頂尖人類選手,“深藍”到Master的發展充分體現出了人類科技進步在計算方法和計算資源上的長足進步。如果說“深藍”是憑借其運算速度通過遍歷戰勝了人類,那么Master是在此基礎上通過優化的搜尋算法,決策支持和計算架構遍歷了當時覺得不可能實現的所有可能。Master所用到的Deep
Reinforcement Learning結合了當今AI領域研究的兩大前沿技術Deep Learning(DL)和Reinforcement
Learning(RL),創造性的使用DL的方式,通過棋局的圖片評估落子的優先級,再結合RL,通過自我“對弈”的方式更新深度神經元網絡的參數,最終帶領人類真正意義上站在了“智能”的門口。AlphaGo最重要的成就并不是采用了性能多么優秀的電腦,而是第一次讓程序可以近似人類的方式去感知、學習、思考和決策。
無論是Master這樣已經存在的,還是在《西部世界》中的BICAMERAL
MIND,人工智能已經大跨步的走進了我們的生活。目前來看,人類所有的外部感知能力例如溫度,加速度等都早已可使用現有的傳感器技術實現,基于機器學習,統計學習的方法更是幫助機器在聽(語音助手),看(computer
vision),讀(NLP),寫(handwriting
recognition),思考(Optimization)等多方面超越人類平均水平。有人預測奇點理論正在以很快的速度成為現實。我們不去探討人工智能的技術本質或是它的倫理問題,如果人工智能真的被規模化地應用,那么能夠對人類社會帶來什么樣的改變和價值?
走出“楚門的世界”
在與Master交手前,棋手柯潔在自己的微博上如是說,可謂一語道出了智能化的真諦。如果智能化僅僅停留在遍歷搜索,相似度分析的層面,那對人類的進步又有何意義。作者看來,人工智能和大數據分析最重要的核心就是要能夠為人類提供全新的認識問題和解決問題的方式,用機器純理性的“思維”方式去輔助人類的思維與決策。
決定人類社會進步速度的最本質的制約要素是“認知的邊界”,所謂知識的邊界則是基于前人的經驗與規則所構建的無形的域。
就像《楚門的世界》當中,劇組為楚門所構建的整個生態,無形的禁錮了他認識問題,解決問題的能力。而當人的認知和判斷無法滿足不斷增長的數據維度和問題復雜度時,依靠人的知識和經驗去驅動和創造的過程就會有邊界。以圖像識別為例,基于人類經驗的數據分析方法,首先使用濾波器對原始圖像經行降噪,在使用濾波器經行圖像邊界識別,最終使用模式識別的方法分辨圖像中不同的物體。這樣的方式,其核心在于濾波器的選擇,濾波器的參數配置以及分類器的選擇都需要經驗支持,不同的組合形式其最終模型輸出的結果差距明顯。如今使用的基于深度學習的CNN方法,將濾波器的類型及參數選擇基于依賴于最終分類器輸出結果的表現,使用反向傳播算法,不斷優化模型結構與參數。這樣的方法,基于大量原始數據,從數據中發現規律,提取有效特征,最終實現更加準確地決策支持。
除了深度神經元網絡研究,機器學習和人工智能領域的研究包括遷移學習,無監督或半監督學習,特征工程,增強學習,對抗網絡等的不斷創新,為人工智能在更多領域的應用和價值創造提供了有力的理論支撐。遷移學習,無監督或半監督學習的研究實現了將統一的模型或模塊的推廣和啟發式應用,類似于人類知識積累到一定程度之后觸類旁通。特征工程的研究,提供了在海量數據當中依照業務需求或者既定規則抽取或者重構有效信息的方法,為認識和研究高維度下的數據科學問題提供了有效地工具。增強學習,對抗網絡等研究領域的不斷創新為在數據樣本不足,數據不完善前提下的智能化問題提供了全新的思路。
從“人工智能”到“工業智能”
從計算機,互聯網行業出身的智能化技術,正在以勢不可當的勢頭橫掃全球各個領域。智能化與工業的結合更是引得全球矚目。從德國的工業4.0到美國的工業互聯網,從GE的Predix到IBM的PMQ,可以看出,工業與智能化技術的結合也必將是下一個風口。
智能的核心在于決策和執行,而決策的核心在于感知和判斷。在工業系統中,IoT技術,
包括傳感器技術,數據傳輸,數據管理等不斷發展,為智能化技術實施提供了可靠的感知基礎。但是目前的工業界大都以人的決策和反饋為核心,這就導致系統中有很大一部分的價值并沒有被釋放出來。系統越是復雜,人的學習曲線就會越緩慢,而當人的學習曲線比技術的進步速度慢時,人就會成為制約技術進步和應用的瓶頸。而人工智能為工業帶來的第一個革命性的改變,就是擺脫人類認知和知識邊界的限制,為決策支持和協同優化提供可量化依據。
現階段,工業智能的應用尚處于探索階段,結合工業領域的特性,在實施階段需要著重考慮以下幾點:
一.問題的定義
在應用人工智能方法解決工業問題時,首先要確定需要解決的問題,一定要避免“拿著錘子找釘子”的情況,不能為了使用算法而徒增問題的復雜度。首先需要將實際問題抽象成可用建模方法解決的問題,需要人員的經驗輔助。微軟亞洲研究院鄭宇博士也強調“培養一個真正的數據科學家需要七到十年時間”。這里的時間其實是對個人基本功以及實戰經驗的非強制指標。
二. 問題的邊界
工業問題與圍棋問題不同,其解決問題的邊界定義不明確,沒有明確的規則。這樣就為解決方案的設計帶來了很大的不確定性。一切模型可以解決的問題都是在前提條件所包含的問題域內,沒有一個方案是可以涵蓋所有的情況,所以在制定工業智能方案時一定要緊密結合業務來定義問題邊界,最終確定解決方案。
工業智能,在智能化算法和技術層面也擁有自身的特點和挑戰:
一. 機理模型是關鍵基礎
工業智能所要解決的問題大都是針對特定設備的特定問題,其數據表征應該符合設備運行的機理。在大量雜亂的數據當中,依照設備運行機理可以幫助選擇、構建出更加有用的變量,為決策支持提供有效依據。特征工程,非監督式學習很大一部分研究工作就是針對如何從海量數據提取有效特征。基于機理的特征提取方法在傳統的故障診斷上應用廣泛,例如軸承故障診斷中所用到的失效頻率。在大數據分析,人工智能沖擊傳統行業的同時,傳統行業的分析方法也在人工智能領域得到應用,在2017年的AAAI榮獲outstandingpaper
award的文章“Label-Free Supervision of NeuralNetworks with Physics and
Domain Knowledge”就是將機理模型加入神經元網絡的訓練當中得到優化的網絡模型。
二. 數據的標準和技術仍有待發展
在工業領域,數據資源是發展智能化的一大障礙。眾所周知,在圖像識別領域有ImageNet,手寫識別有MNIST,UCI的機器學習數據庫也提供了大量標準,有標注的訓練數據組。在工業領域,數據獲取需要投入較大資金和時間,同時數據的標注需要專家知識協助,更增加了獲取大量標準數據組的難度。除此之外,受限于傳感器技術,設備使用狀態等,經常會出現關鍵數據無法獲取的情況。上述條件就導致在模型開發時,經常會遇到樣本量小,不平衡數據組,數據質量差,數據不完整,缺少失效狀態數據等問題。所以,IoT、遷移學習、增強學習、半監督式學習的研究對于工業智能技術的發展至關重要。
三. 一體化解決方案 - 從“產品”到“能力”的全方位交付
在解決方案的設計上,工業智能是多層次,高準確度的解決方案,有時還需要實時計算與回饋。這樣的特點就要求所訓練和部署的模型計算速度快,結果準確,不確定性小。因此,需要有能夠靈活重構的工業數據應用模塊,以快速開發解決工業系統中碎片化問題的應用。同時可以看出,工業智能的解決方案不是僅僅依賴于智能算法,整個鏈條上的每一環節的共同進步才可以保證技術的進步。那么,可以通過可視化的編程環境降低數據分析和應用開發的門檻,以及通過培訓,是企業的工程師可以根據自己的經驗和需求開發個性化的預測和分析應用,來保證持續地解決企業在發展過程中遇到的問題。
中國特色工業智能之路
我國工業智能化起步較晚,工業基礎相對落后,但是我們是設備使用大國,設備保有量和設備使用數據保有量都是當之無愧的世界第一。結合設備、業務場景和智能算法,依靠成熟的CPS理論框架,相信我國一定會在工業智能引領世界發展。