7x24小時免費電話:
楊柳風月網
  • 關鍵詞不能為空

實時熱點

楊柳風月網 > 實時熱點 > 相芯科技亮相音視頻大會,解讀AI+3D內容互動技術

相芯科技亮相音視頻大會,解讀AI+3D內容互動技術

小文
相芯科技亮相音視頻大會,解讀AI+3D內容互動技術

  4月19-20日,專注于音視頻領域的多媒體技術峰會——LiveVideoStackCon在上海順利閉幕。本次大會以“技術開啟新視界”為主題,匯聚了全國音視頻技術的資深專家和從業者,圍繞畫質評價與增強、服務端與架構設計、前端與用戶端、音頻技術和解決方案等不同方向展開深入挖掘和探討,不斷拓展了音視頻技術的應用場景和行業邊界。

  在“解決方案”專場的主題演講中,相芯科技資深圖形引擎開發經理蔡銳濤從音視頻內容互動技術、行業實踐及全鏈路人臉AR特效解決方案三個角度,全方位介紹了相芯科技內容互動技術在音視頻領域的新實踐,并展示了其豐富的AI+3D內容生成與互動的行業解決方案。

  創新內容互動技術,20余款功能隨你挑

  隨著經濟社會加速發展,與互聯網一起成長起來的Z世代正在成為社會新的消費主力。他們追求個性與自我,崇尚興趣至上,熱愛社交,渴望被關注,并將“虛擬”網絡世界當成他們追求精神活動的載體,從中尋求自我認同和自我成長。

  如何吸引他們的目光,抓住他們的需求,進而助推音視頻行業發展?蔡銳濤從人臉內容互動技術切入,全面介紹了相芯科技通過技術提升內容層次、豐富內容趣味、拓展內容邊界,從而幫助用戶有效提升內容觸達率,大大強化了企業與用戶間的粘性。

  (AI+3D內容互動新技術)

  會上,蔡銳濤深入剖析了相芯科技的三款產品——NAMA、PTA、STA。這些產品基于不同的底層技術,為各類企業的內容創造提供了更多可能。以NAMA產品線為例,經過近3年的發展,已延伸出了美顏、貼紙、Animoji、背景分割、海報換臉等16項功能。其中,在美顏技術方面,相芯科技已擁有包含美顏、美妝、美型、濾鏡等在內的一套完整的解決方案,并于不久前推出了主打質感美顏的SDK包。

  PTA(Photo-to-Avatar)是一項可以根據用戶上傳的自拍照片,生成與用戶相似且美觀的3D虛擬形象的服務。相芯科技的生成算法目前可以自動匹配臉型、五官特征、頭發胡子、膚色唇色、眼睛等,生成和輸出與人像高度匹配的3D數字化身。且生成后,還支持用戶進行捏臉調整,實時裝扮虛擬形象,及進行實時表情驅動。

  STA(speech-to-animation)語音驅動是相芯科技研發的一套驅動虛擬形象嘴唇動作與語音實時同步呈現的產品技術。這一技術在內容動態呈現和內容制作兩方面有很好的落地場景,可為用戶提供一種內容創作低門檻、體驗更自然的語音人機交互方式。

  “經過近3年的發展,我們已積累了400+家B端用戶,SDK月均鑒權調用已超10億次。”蔡銳濤說,目前相芯科技的全鏈路人臉AR特效解決方案,已經成為涵蓋內容生成、內容交互、內容渲染的一個完整解決方案,可滿足各類用戶對AI+3D內容創作的需求。

  視頻社交成主流,SDK走向輕量化

  近年來,在監管收緊、技術迭代、消費升級、人工智能應用越來越廣的背景下,短視頻行業正在迎來一輪新的洗牌。如何在這一輪競爭中尋求突破口,為更多短視頻企業的發展賦能?以技術來撬動內容生產,滿足不同用戶的不同需求,是相芯科技一直以來的追求。

  蔡銳濤指出,從今年初開始,市場上已出現了頭條多閃、聊天寶、馬桶MT等多個主打視頻社交的產品,陌生人社交或將成為年輕一代的主流模式。而相芯科技早已瞄準這一領域,并研發出了Avatar捏臉技術。

  (動圖)

  這一SDK開發包首先具有輕量級的渲染引擎,提供多種材質模板,可供客戶快速自定義渲染效果,且SDK包最小只有2.6M;其次,還支持用戶根據自己喜好對虛擬角色進行捏臉、換裝、換發等,制作出一個和自己很像且更美觀的3D數字化身;最后,還提供內容制作工具,方便讓客戶隨時做出想要的產品。

  此外,針對模型道具制作過程中可能存在的運行內存問題,蔡銳濤表示,相芯科技研發了數據壓縮和模型優化技術,力爭用最小的運行內存來實現用戶實時捏臉、驅動虛擬形象等效果。以模型8000個頂點、40個捏臉維度為例,全部模型內存占用最少需要458M,但經過壓縮優化后,相芯科技可將運行內存降至60M,讓絕大部分的設備都可以使用。

  (音視頻處理SDK架構)

相關閱讀

與本文更多相關文章

關鍵詞不能為空
智能產品

多情自古傷離別,更那堪冷落清秋節。

北京28开奖号码