• 汽車導航 汽車導航
    Ctrl+D收藏汽車導航
    首頁 > 汽車資訊 > 正文

    自動駕駛下的AI識別,數據標注賦能背后的自動化偽命題

    作者:

    時間:1900/1/1 0:00:00

    在智能駕駛中,汽車需要通過感知、規劃、決策和控制等方面的努力,使機器“智能化”。人們通常愿意將這一過程稱為人工智能。事實上,所謂的智慧只是一個結果。為了使機械智能化,在這個過程中需要無數的人力。數據標注就是這樣一項工作,它的意義在于讓機器理解和了解世界。通常,數據注釋包括語音、文本、圖像等。工人需要對具有更多行業標準或客戶要求的相應數據進行分類、框定、注釋、標記等,然后將生成的數據反饋給客戶。據此,客戶訓練機器了解上述特征,C端用戶體驗到的智能語音交互和視覺圖像識別都來自于此。數據標注是一項手工工作,需要大量人員進行簡單重復的工作,且成本較高。該行業也在尋找一種自動化的方式。

    業內人士告訴高科智能汽車,自動數據標注在當前行業仍然是一個“遙遠的夢想”,在可預見的時期內,數據標注將由人主導。數據標簽的分類數據標簽的對象通常包括圖像、語音、文本、視頻、雷達等。圖像類別主要針對視覺識別公司,需要標記的圖像內容包括肖像、建筑物、植物、道路、交通標志、車輛等。在每種內容下,會根據不同的特征標記不同的標簽。以使用最廣泛的肖像為例,標簽公司可能需要標記目標的性別、年齡、膚色、著裝、表情、發型和姿勢,方法將是框定和標簽。拼音標注也是一種常見的標注方式。該公司將對比編寫音頻文本,并可能在句子中標記主語、謂語和賓語,以便于機器學習。隨著激光雷達在自動駕駛中的頻繁應用,對雷達掃描和識別障礙物的需求越來越頻繁,如何將激光雷達掃描到的物體以更直觀的形式顯示給用戶成為一項有待完成的任務。數據標注公司將大致勾勒出激光雷達掃描到的物體,還將標記相應的障礙物,包括但不限于它們的名稱和類別,并以不同的顏色顯示。經過這種深度處理后,激光雷達也間接具備了識別障礙物的能力。無論是圖像、語音還是雷達數據的標簽,數據標簽公司通常都有自己的標準來對數據進行分類,目標客戶也會有自己的標簽。業內人士表示,一般來說,客戶會有自己的需求,公司會遵守規則。目前,在中國,阿里巴巴、騰訊、百度等大型互聯網公司對數據標注的需求巨大,單筆訂單量以億元為單位。如此大的訂單基本上是分包給不同的數據標注公司進行處理,國內外沒有一家公司能夠處理如此大的一筆訂單。此外,還有自動駕駛公司和視覺圖像處理公司,它們對數據標簽也有很強的需求。他們需要用標注的數據來訓練人工智能,而人工智能的成熟是永無止境的。面對巨大的數據標簽需求,勞動密集型行業的技術水平如何?在回答這個問題之前,我先給你一組數據。ImageNet是一個計算機視覺系統識別項目的名稱,該項目由美國斯坦福大學計算機科學家李飛飛教授領導的團隊建立,旨在模擬人類識別系統。它是目前世界上最大的圖像識別數據庫,擁有1500萬張圖片。來自167個國家的48940名工作人員花了兩年時間對通過互聯網收集的近10億張圖片進行了清理、分類和標記。由于數據量巨大且開源,ImageNet很快成為研究圖像識別的首選。然而,ImageNet也有自己的弱點:標記框太大,標記方法太少,錯誤不時出現,這使得它很難用于訓練實用的算法模型。從上面可以看出,即使是業界最強大的圖像識別數據庫,數據注釋也是手動完成的。因此,其他宣傳數據的標注是自動的,可信度較低。據業內人士透露,數據實驗室……

    ing是一件簡單而困難的事情。簡單之處在于,篩選規則確定后,操作人員只需遵循規則,執行起來并不困難。難點在于,數據標注的本質是獲得更準確、更精細的數據結果,行業急需高質量的數據。然而,數據注釋本身是一項枯燥的工作,工作人員需要重復大量數據,因此很難確保數據的一致性。標記這些數據的工作本身就是為了提高機器學習的能力,所以這部分工作只能由人來完成,而人和機器之間的差距正是機器想要跨越的。數據標注公司目前的做法是雇傭一些專業的標注人員,然后雇傭一些兼職人員一起完成訂單。由于勞動力成本高,大多數數據標簽公司都在三線以下城市設立了公司。專業人員和兼職人員的工作能力仍有一定差距。為了確保數據標注的質量,數據標注公司通常會成立一個審計小組來檢查標注的數據。數據收集和標記是一項高度專業的工作,必須對每種材料進行專業指導。培訓過程包括理解目標、學習規則和在線培訓&;視頻學習實景實習標準考試工作糾錯講解&;

    糾正錯誤(如果錯誤嚴重,輸出不達標,則返回規則學習階段)。在審計方面,公司將采用多種交叉審計審計機制進行標記和審計,并嚴格控制標記的每個過程。據業內人士透露,數據標注的人工成本仍然很高。以語音數據為例,客戶通常會提供完整有效的數據音頻,然后根據完成的有效時間段來衡量價格。音頻通常包含方言、噪音等。標記者有時需要反復聽音頻才能完成將音頻轉換為文本的工作。一個小時的音頻通常需要一天的時間才能完成,業內給出的價格通常在300元左右。這個市場是完全免費的。甲乙雙方一方面要考慮成本、質量等因素,另一方面也要考慮勞動力成本。由于技術含量低,成長空間小,數據標注工作大多是短期的,員工積極性低,面臨人才流失的問題。資本市場的博弈最終會找到一個平衡點,讓工人愿意留下來繼續工作。在眾包下,半自動資本是逐利的。為了降低成本和提高效率,數據標簽公司和客戶都在努力提高數據標簽的效率。人們更多地談論數據標簽自動化,但業內人士表示,數據標簽自動化是一個偽命題。除了技術可行性之外,完成自動化所需的人才在業內是罕見的。本質上,大公司最有能力做這部分工作,但現實是,大公司的數據標簽業務基本上外包給了小公司。另一方面,小公司仍沉浸在海上戰術中。為了提高貼標效率和降低成本,數據貼標公司基本上都是眾包和半自動化。所謂的眾包,類似于國外高精度地圖的采集,即公司在網上發布訂單,讓有空閑時間的網友一起完成數據標注的工作,這可能涉及到給予一些獎勵,但與目前線下繁重的勞動模式相比,降低了很多成本。然而,眾包形式對數據標注的工作流程有更高的要求。網絡用戶在完成數據標注時必須簡單、快速、易用,才能普及。目前,數據標注過程需要人工框定、標注和后續人工審核,整個過程比較復雜。據業內人士介紹,現在可以提高效率的工作是開發一個在線系統,簡化和規范貼標工作,最大限度地減少貼標人員的一些重復和簡單的工作。開發這樣的系統需要專業的研發人員,而大多數數據標簽公司很少有多余的能力來進行這部分純粹的投資和研發。因此,數據標簽公司未來的目標是實現半自動數據標簽,而這背后仍然依賴于眾包。所謂的自動標注本身就是一個偽命題。如果數據可以自動標注,那么本質上就沒有必要標注,因為人工智能已經具備了和人類一樣的識別能力。這一天什么時候到來?大家所期待的~在智能駕駛中,汽車需要通過感知、規劃、決策和控制等方面的努力,使機器“智能化”。人們通常愿意將這一過程稱為人工智能。事實上,所謂的智慧只是一個結果。為了使機械智能化,在這個過程中需要無數的人力。數據標注就是這樣一項工作,它的意義在于讓機器理解和了解世界。通常,數據注釋包括語音、文本、圖像等。工人需要對具有更多行業標準或客戶要求的相應數據進行分類、框定、注釋、標記等,然后將生成的數據反饋給客戶。據此,客戶訓練機器了解上述特征,C端用戶體驗到的智能語音交互和視覺圖像識別都來自于此。數據標注是一項手工工作,需要大量人員進行簡單重復的工作,且成本較高。該行業也在尋找一種自動化的方式。

    業內人士告訴高科技智能汽車,自動數據標簽仍然是一個“dis……”……

    nt dream”在當前行業中,在可預見的時期內,數據標簽將由人主導。數據標簽的分類數據標簽的對象通常包括圖像、語音、文本、視頻、雷達等。圖像類別主要針對視覺識別公司,需要標記的圖像內容包括肖像、建筑、植物、道路、交通標志、車輛等。在每個內容下,會根據不同的特征標記不同的標簽。以使用最廣泛的肖像為例,標簽公司可能需要標記目標的性別、年齡、膚色、著裝、表情、發型和姿勢,方法將是框定和標簽。拼音標注也是一種常見的標注方式。該公司將對比編寫音頻文本,并可能在句子中標記主語、謂語和賓語,以便于機器學習。隨著激光雷達在自動駕駛中的頻繁應用,對雷達掃描和識別障礙物的需求越來越頻繁,如何將激光雷達掃描到的物體以更直觀的形式顯示給用戶成為一項有待完成的任務。數據標注公司將大致勾勒出激光雷達掃描到的物體,還將標記相應的障礙物,包括但不限于它們的名稱和類別,并以不同的顏色顯示。經過這種深度處理后,激光雷達也間接具備了識別障礙物的能力。無論是圖像、語音還是雷達數據的標簽,數據標簽公司通常都有自己的標準來對數據進行分類,目標客戶也會有自己的標簽。業內人士表示,一般來說,客戶會有自己的需求,公司會遵守規則。目前,在中國,阿里巴巴、騰訊、百度等大型互聯網公司對數據標注的需求巨大,單筆訂單量以億元為單位。如此大的訂單基本上是分包給不同的數據標注公司進行處理,國內外沒有一家公司能夠處理如此大的一筆訂單。此外,還有自動駕駛公司和視覺圖像處理公司,它們對數據標簽也有很強的需求。他們需要用標注的數據來訓練人工智能,而人工智能的成熟是永無止境的。面對巨大的數據標簽需求,勞動密集型行業的技術水平如何?在回答這個問題之前,我先給你一組數據。ImageNet是一個計算機視覺系統識別項目的名稱,該項目由美國斯坦福大學計算機科學家李飛飛教授領導的團隊建立,旨在模擬人類識別系統。它是目前世界上最大的圖像識別數據庫,擁有1500萬張圖片。來自167個國家的48940名工作人員花了兩年時間對通過互聯網收集的近10億張圖片進行了清理、分類和標記。由于數據量巨大且開源,ImageNet很快成為研究圖像識別的首選。然而,ImageNet也有自己的弱點:標記框太大,標記方法太少,錯誤不時出現,這使得它很難用于訓練實用的算法模型。從上面可以看出,即使是業界最強大的圖像識別數據庫,數據注釋也是手動完成的。因此,其他宣傳數據的標注是自動的,可信度較低。業內人士表示,數據標注是一件簡單而困難的事情。簡單之處在于,篩選規則確定后,操作人員只需遵循規則,執行起來并不困難。難點在于,數據標注的本質是獲得更準確、更精細的數據結果,行業急需高質量的數據。然而,數據注釋本身是一項枯燥的工作,工作人員需要重復大量數據,因此很難確保數據的一致性。標記這些數據的工作本身就是為了提高機器學習的能力,所以這部分工作只能由人來完成,而人和機器之間的差距正是機器想要跨越的。數據標注公司目前的做法是雇傭一些專業的標注人員,然后雇傭一些兼職人員一起完成訂單。由于勞動力成本高,大多數數據標簽公司都在三線以下城市設立了公司。專業人員和兼職人員的工作能力仍有一定差距。為了確保數據標注的質量,數據標注公司通常會成立一個審計小組來檢查標注的數據。數據列……

    操作和標記是高度專業的工作,必須對每種材料進行專業指導。培訓過程包括理解目標、學習規則和在線培訓&;視頻學習實景實習標準考試工作糾錯講解&;糾正錯誤(如果錯誤嚴重,輸出不達標,則返回規則學習階段)。在審計方面,公司將采用多種交叉審計審計機制進行標記和審計,并嚴格控制標記的每個過程。據業內人士透露,數據標注的人工成本仍然很高。以語音數據為例,客戶通常會提供完整有效的數據音頻,然后根據完成的有效時間段來衡量價格。音頻通常包含方言、噪音等。標記者有時需要反復聽音頻才能完成將音頻轉換為文本的工作。一個小時的音頻通常需要一天的時間才能完成,業內給出的價格通常在300元左右。這個市場是完全免費的。甲乙雙方一方面要考慮成本、質量等因素,另一方面也要考慮勞動力成本。由于技術含量低,成長空間小,數據標注工作大多是短期的,員工積極性低,面臨人才流失的問題。資本市場的博弈最終會找到一個平衡點,讓工人愿意留下來繼續工作。在眾包下,半自動資本是逐利的。為了降低成本和提高效率,數據標簽公司和客戶都在努力提高數據標簽的效率。人們更多地談論數據標簽自動化,但業內人士表示,數據標簽自動化是一個偽命題。除了技術可行性之外,完成自動化所需的人才在業內是罕見的。本質上,大公司最有能力做這部分工作,但現實是,大公司的數據標簽業務基本上外包給了小公司。另一方面,小公司仍沉浸在海上戰術中。為了提高貼標效率和降低成本,數據貼標公司基本上都是眾包和半自動化。所謂的眾包,類似于國外高精度地圖的采集,即公司在網上發布訂單,讓有空閑時間的網友一起完成數據標注的工作,這可能涉及到給予一些獎勵,但與目前線下繁重的勞動模式相比,降低了很多成本。然而,眾包形式對數據標注的工作流程有更高的要求。網絡用戶在完成數據標注時必須簡單、快速、易用,才能普及。目前,數據標注過程需要人工框定、標注和后續人工審核,整個過程比較復雜。據業內人士介紹,現在可以提高效率的工作是開發一個在線系統,簡化和規范貼標工作,最大限度地減少貼標人員的一些重復和簡單的工作。開發這樣的系統需要專業的研發人員,而大多數數據標簽公司很少有多余的能力來進行這部分純粹的投資和研發。因此,數據標簽公司未來的目標是實現半自動數據標簽,而這背后仍然依賴于眾包。所謂的自動標注本身就是一個偽命題。如果數據可以自動標注,那么本質上就沒有必要標注,因為人工智能已經具備了和人類一樣的識別能力。這一天什么時候到來?每個人的期望~

    標簽:

    汽車資訊熱門資訊
    奇瑞汽車擬以不低于200億元引入外部投資者

    雖然此前奇瑞方面已單方否認了股權出售事宜,但奇瑞內部已經就此事達成共識。

    1900/1/1 0:00:00
    3年內L3級別量產,“自動駕駛”離我們的遠與近

    “自動駕駛”是一個熱度頗高的詞匯。再加上某些有意無意的渲染和夸大,人們對“自動駕駛”滿滿都是憧憬和膜拜,甚至有的是迫不及待。

    1900/1/1 0:00:00
    生產資質大門將重新打開 那些已獲資質的“鯰魚”們現狀如何?

    不到半年的時間,8家企業新建純電動乘用車生產項目在2017年上半年獲得發改委核準通過。

    1900/1/1 0:00:00
    2020年投入使用 MEB平臺落戶一汽-大眾

    日前,我們從招標網獲得了大眾MEB平臺落戶一汽大眾的信息,從曝光的細節來看,由一汽大眾佛山工廠生產的MEB平臺產品或將于2020年正式發布上市。

    1900/1/1 0:00:00
    對于共享汽車的危局,這五位行業創業者這樣說……

    江湖上流行著一句話,天下武功,唯快不破。天下任何武功,都有自己的不足,防守的再好,也有破解方法,只要意識、攻、守、應激變化等速度遠遠高于對方,勢必游刃有余。

    1900/1/1 0:00:00
    浙江合眾獲第七張新能源牌照,新能源“準生證之爭”會再度開啟嗎?

    5月17日,工信部發布了第308批《道路機動車輛生產企業及產品公告》,其中,浙江合眾新能源汽車有限公司進入擬發布新增車輛生產企業清單。

    1900/1/1 0:00:00
    幣安下載官方app安卓歐意交易所APP下載
    亚洲欧美色图