AI5天訓練-視覺生產技術探究和應用

原創

涂诣

2020-05-17 15:23

視覺生產技術探究和應用

概念理解

定義

通過一個或一系列視覺過程，產出新的視覺表達，是人或機器能夠感知的圖像視頻，而不是標籤或特徵。

通用基礎框架

五個關鍵維度

1.可看（滿足視覺/美學表現）

2.合理（合乎語義/內容邏輯）

3.多樣（保證結果的豐富性）

4.可控（提供用戶預期的抓手）

5.可用（帶來用戶/商業價值）

精細理解

分割摳圖

識別：能知道圖片中物體，知道物體是什麼。
檢測：能識別，還要能知道在哪個區域。
分割：識別、檢測、並知道每一個像素是什麼，能將區域完整切割分離。

難點

複雜背景
遮擋
髮絲精摳（圖像中毛髮等細微處
邊緣反色
透明材質（圖像中玻璃等
多尺度/目標
數據嚴重不足，標註成本高

解題思路
Semantic Segmentation（語義分割）

Instance Segmentation（實例分割）

Image Matting（摳圖）

思路：1.複雜問題拆解：粗mask估計+精準matting
2.豐富數據樣本：設計圖像mask統一模型

模型框架

Step1：mask粗分割

Step2：mask質量統一

Step3：估計精確alpha

視覺生成

框架流程

1.理需求

2.定草圖

3.選狀態

4.調細節

5.生成圖

6.評好壞

視覺編輯

視頻植入作用

挖掘視頻核心價值
擴大植入覆蓋範圍
提升植入效果效率

關鍵點

（廣告等）植入位檢測與定位

動態檢測分割

視頻內容擦除

文字擦除

Logo擦除

畫幅變化（縮放

圖像尺寸變化

視覺增強

視頻增強
人臉修復增強
渲染圖超分
視頻插幀
HDR色彩擴展
風格遷移
顏色拓展

視覺製造

實體設計製造

缺點

效率低：多次打樣，多次溝通（服裝設計平均30天）
協同差：設計、營銷、生成脫節、倒置
定製難：無法實現柔性生產

核心邏輯

包裝幾何生成

服裝幾何生成

材質工藝

多樣性拓展

2D3D融合

應用平臺

鹿班

鹿班是視覺生成領域在業界落地的先行者，對外提供大規模在線的AI設計服務

AlibabaWood

AI生成商品短視頻，能做到劇本生成、智能文案生成、自動剪輯、智能音樂推薦。

阿里雲視覺開放平臺

提供高易用、普惠的視覺API服務

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

AI5天訓練-視覺生產技術探究和應用

視覺生產技術探究和應用

概念理解

定義

分類

通用基礎框架

五個關鍵維度

精細理解

分割摳圖

視覺生成

框架流程

視覺編輯

關鍵點

視覺增強

視覺製造

實體設計製造

應用平臺

鹿班

AlibabaWood

阿里雲視覺開放平臺

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

大齡程序員思考

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

WebStorm 創建 Vue 項目

AI5天訓練-視覺生產技術探究和應用

PHP正則提取table中數據

微信小程序request:fail invalid url

Java泛型的學習與應用

軟件測試工程師筆試總結

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結