曠視研究院堅持做“長期主義”者,見證時間的力量
2022-04-06 10:55:29 來源: GPLP
0瀏覽 評論0條
作為曠視消費物聯網業務的重要后方力量,成都研究院的使命可謂“頂天立地”。向下,夯實算法產業發展地基,通過更加智能的手機影像算法助人們在不同環境下拍出更高質感圖像;向上,在 HDR、Denoise、SR、光流等與業務密切相關的細分賽道上展開更加極致的探索,在 CVPR、ICCV 等頂級會議上持續輸出“曠視勢能”。
“科研做上限,產品看下限”,曠視成都研究院負責人劉帥成以此總結科研與商業化二者間的“鴻溝”。但正因如此,成研院為打通“產學研用”融通壁壘提供了肥沃土壤,為激發科技創新氛圍默默蓄力。
從零開始 科研之路要如何蹚?
自2018年成立以來,成研院累計發表 10 多篇論文被CVPR/ICCV/ECCV/AAAI 頂會收錄,這樣的成果足夠令人驚喜。期間付出的心血,實非朝夕之功。2019 年下半年,成研院轉型聚焦于手機影像算法研究領域。回顧那段日子,劉帥成坦言最頭疼的是很多同學之前并不是研究這個領域的,剛開始不知怎樣搞科研,既對手機影像算法缺乏深入了解,也不清楚完成一篇 CVPR 需要經歷什么樣的過程。
而對于劉帥成來說,圖像研究并不陌生,他一直專注于底層視覺和計算攝影學研究,具有多年科研經驗,于是他決意帶大家一點點來。他把“怎么讀 paper、怎么想 idea、想到 idea 后怎么做實驗”等繁雜的任務逐個拆解下去。“剛開始,大家想到的 idea,要么跟別人撞了,要么就根本不可能發表。”
憑借對商業落地實踐的持續觀察,每周兩次雷打不動的“Paper Reading”,以及隊內日漸高漲的“傳幫帶”科研氛圍,團隊的科研能力逐漸提升,最終形成了 2021 年的井噴之勢。
“這其實是互相影響的過程,有些同學感覺自己做了很久的項目,也想嘗試發點論文,或者有些同學看到別人打比賽拿了獎或者是發了頂會,他可能也會想去嘗試一下。”
而在 CVPR NTIRE(New Trends in Image Restorationand Enhancement, 即圖像恢復與增強的新趨勢)2021 挑戰賽上,成研院還包攬了圖像超分辨率、圖像 HDR 兩大賽道的冠軍。
提到團隊首次打比賽的經歷,劉帥成坦言一切都靠摸索。“整個比賽過程中,我們能看到不同賬號在榜單上的排位,有段時間我們團隊始終處在第二或第三的位置,我們就使勁想辦法搭各種模型,A 同學把這幾個結構試了,B 同學把那幾個結構試了。要試哪些結構,大家會先開會討論 To Do List,對每一項任務做到精細的時間管理和計劃制定。”
最終結果多少有些讓人意外。開始排在第二第三名的比賽,成研院最終斬獲了冠軍;而長期排在榜一位置的一項比賽,反而因為大意而被后面的人追了上來,最終拿到亞軍。“今年我們也要吸取這樣的教訓,一次排在第一并不代表最后也排在第一,剛開始排在第二第三名,也不代表最后沒有機會去反超。”
重在實踐 如何叩開商業的門?
將科研成果應用于商業世界,推進產品落地是成研院立足之本。尤其是面對智能手機“影像為王”的加速進化,更需要AI算法配合不同平臺的硬件實力更好發揮效能。一個好的算法最終能夠實現工程化落地,中間需經歷包括模型優化、加速、質量評估等多環節流程。為此,劉帥成強調,相較于科研對“最好”的追逐,做產品更要關注“下限”,“將算法應用到產品中去,各種情況都要考慮到,對用戶來說,質量和成片率都很重要。”
另一方面,不同于實驗中完全客觀的結果,不同客戶 QA(Quality Assurance,品控)的標準、偏好也將極大地影響算法優化。有的 QA 對圖像“發灰”很敏感,有的 QA 對噪聲很敏感,這就要依據不同重點去發力。劉帥成表示:“手機產品迭代節奏很快,尤其臨近產品發布的時候,我們內部要跟客戶交互著測試,一周可能要發布幾個版本,以進行高速迭代反饋。