why we need validation set?

原創

2020-06-16 08:43

典型的數據分類是訓練集-測試集。這種模式存在的問題是，在反覆的調參中，比如 learning rate 等，我們會反覆使用測試集，導致模型過於在意某些特徵，從而產生過擬合等問題，喪失一般性。

In the figure, “Tweak model” means adjusting anything about the model you can dream up—from changing the learning rate, to adding or removing features, to designing a completely new model from scratch. At the end of this workflow, you pick the model that does best on the test set.

所以我們需要驗證集，將上述模式改爲訓練集-驗證集-測試集，訓練和驗證都在前兩個集合上完成，最後用測試集做性能測試。

Test sets and validation sets “wear out” with repeated use. That is, the more you use the same data to make decisions about hyperparameter settings or other model improvements, the less confidence you’ll have that these results actually generalize to new, unseen data.

If possible, it’s a good idea to collect more data to “refresh” the test set and validation set. Starting anew is a great reset.

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

AI從入門到入門之手寫數字識別模型java方式Dense全連接神經網絡實現

前言：授人以魚不如授人以漁.先學會用，在學原理，在學創造，可能一輩子用不到這種能力，但是不能不具備這種能力。這篇文章主要是介紹算法入門Helloword之手寫圖片識別模型java中如何實現以及部分解釋。目前大家對於人工智能-機器學習-神經網

2024-04-19 23:17:21

如何基於香橙派AIpro對視頻/圖像數據進行預處理

本文分享自華爲雲社區《如何基於香橙派AIpro對視頻/圖像數據進行預處理》，作者：昇騰CANN。受網絡結構和訓練方式等因素的影響，絕大多數神經網絡模型對輸入數據都有格式上的限制。在計算機視覺領域，這個限制大多體現在圖像的尺寸、色域、歸一

2024-04-19 10:32:52

基於香橙派AIpro將開源框架模型轉換爲昇騰模型

本文分享自華爲雲社區《如何基於香橙派AIpro將開源框架模型轉換爲昇騰模型》，作者：昇騰CANN。在前面的介紹中，我們知道了如何基於香橙派AIpro開發AI推理應用，也大致瞭解到在推理之前，需要把原始網絡模型 (可能是 PyTorch 的

2024-04-12 10:32:18

大模型分佈式訓練並行技術

隨着深度學習的發展，模型規模逐漸增大，數據量和計算需求也呈爆炸式增長。在單個計算設備上完成大模型的訓練變得不切實際，因此，分佈式訓練成爲了解決這一問題的關鍵。在分佈式訓練中，數據並行是一種非常有效的策略，通過將數據和計算任務分佈到多個計算設

2024-04-10 23:29:41

TorchAcc：基於 TorchXLA 的分佈式訓練框架

本文旨在探討阿里雲 TorchAcc，這是一個基於 PyTorch/XLA 的大模型分佈式訓練框架。過去十年 AI 領域的顯著進步，關鍵在於訓練技術的革新和模型規模的快速攀升。儘管大模型展現了堪比人類的理解力，但其訓練卻對算力提出了極高的

2024-04-01 23:39:48

愛奇藝 CTR 場景下的 GPU 推理性能優化

01 背景介紹 GPU 目前大量應用在了愛奇藝深度學習平臺上。GPU 擁有成百上千個處理核心，能夠並行的執行大量指令，非常適合用來做深度學習相關的計算。在 CV（計

2024-03-15 15:57:51

京東廣告算法架構體系建設--高性能計算方案最佳實踐

1、前言推薦領域算法模型的在線推理是一個對高併發、高實時有較強要求的場景。算法最初是基於Wide & Deep相對簡單的網絡結構進行建模，容易滿足高實時、高併發的推理性能要求。但隨着廣告模型效果優化進入深水區，基於Transformer

2024-03-15 13:45:05

語言大模型的浮點運算分配優化策略

隨着人工智能技術的不斷髮展，語言大模型（Large Language Models, LLMs）在自然語言處理、語音識別、機器翻譯等領域的應用越來越廣泛。這些模型通常包含數十億甚至上萬億的參數，對計算資源和浮點運算能力提出了極高的要求。如何

2024-03-15 00:33:17

揭祕QQ的AI繪畫大模型技術——QQGC深度解析

隨着人工智能技術的飛速發展，AI繪畫已經成爲了一個備受矚目的領域。在這個領域中，QQGC——QQ的AI繪畫大模型技術，憑藉其卓越的性能和實用性，贏得了廣大用戶的喜愛。那麼，QQGC到底是什麼？它是如何實現的呢？本文將對這些問題進行深入解析。

2024-03-08 00:41:36

阿里雲容器服務助力萬興科技 AIGC 應用加速

2023 年堪稱是 AIGC 元年，文生圖領域誕生了 Stable Diffusion 項目，文生文領域誕生了 GPT 家族。一時間風起雲湧，國內外許多企業投身 AIGC 創新浪潮，各大雲廠商緊隨其後紛紛推出自己的大語言模型。在文生圖領域落

2023-12-28 01:18:57

輕鬆搭建基於服務網格的 AI 應用，然後開始玩

在 2023 年的雲棲大會中，阿里雲服務網格 ASM 推出了《兩全其美：Sidecarless 與 Sidecar 模式融合的服務網格新形態》主題演講，並在演講中展示了一個基於服務網格 ASM 各項能力構建的 DEMO AI 應用。該應用集

2023-12-01 12:48:04

便捷、快速、穩定、高性能！以 GPU 實例演示 Alibaba Cloud Linux 3 對 AI 生態的支持

日前，Alibaba Cloud Linux 3 爲使 AI 開發體驗更高效，提供了一些優化升級，本文爲“Alibaba Cloud Linux 3 AI 能力介紹”系列文章預告篇，以 GPU 實例爲例，爲大家演示 Alibaba Clou

2023-09-09 00:19:13

Deep Reinforcement Learning製作遊戲AI初探

參考github案例，通過 Deep Reinforcement Learning（DQN算法）訓練能玩貪喫蛇的AI。環境搭建基於python + tenso

2023-03-27 00:45:40

解讀最佳實踐：倚天710 ARM芯片的 Python+AI 算力優化

編者按：在剛剛結束的 PyCon China 2022 大會上，龍蜥社區開發者朱宏林分享了主題爲《ARM 芯片的 Python+AI 算力優化》的技術演講。本次演講，作者將向大家介紹他們在倚天 710 ARM 芯片上開展的 Python+A

2022-12-29 11:56:33

PolyGen生成三維模型【深度學習】

本文將介紹如何利用深度學習技術生成3D模型，使用了PyTorch和PolyGen。 1、概述有一個新興的深度學習研究領域專注於將 DL 技術應用於 3D 幾何和計算機圖形應用程序，這一長期研究的集合證明了這一點。對於希望自己嘗試一些 3

2022-04-30 12:13:09

24小時熱門文章

最新文章

最新評論文章