发布时间:2026/7/4 4:00:45
深度学习中常见的三大“超参”
如果说参数是机器自己摸索出来的那么超参数就是人类在训练开始前强行给机器定下的“规矩”和“大前提”。我们继续用最通俗的语言把“参数”和“超参数”彻底区分开来。一、 通俗解释超参数是“教练的战术板”通俗解释在 AI 训练中参数是机器在训练过程中自己不断微调的“旋钮”而超参数是人类在按下“开始训练”按钮之前手动设置的“全局设定”。机器在训练时绝对不能自己修改超参数。生活中的例子培养一个运动员假设你要训练一个短跑运动员AI 模型参数机器自己调运动员的肌肉发力习惯、呼吸节奏。这些是他在每天训练中自己体会、不断微调的。超参数教练手动定你作为教练赛前给他定的规矩。比如“今天只练 2 个小时”这对应 AI 中的Epoch / 训练轮数。“每次休息 5 分钟”这对应 AI 中的Batch Size / 批次大小。“每天最多只能进步 1 毫米不能急于求成”这对应 AI 中的Learning Rate / 学习率。运动员在跑步时会自己调整发力参数但他绝对不能自己决定今天练几个小时。练几个小时必须由教练人类提前定好。这个教练定的规矩就是超参数。二、 深度学习中最常见的三大“超参”在神经网络中有几个超参数决定了训练的生死学习率Learning Rate通俗解释机器每次“改错”时的步子迈多大。影响步子太大学习率高容易直接跨过正确答案导致模型崩溃步子太小学习率低机器学得太慢可能练一辈子也达不到终点。批次大小Batch Size通俗解释机器每次看多少道题才总结一次经验更新一次参数。影响一次看太多题机器容易“死记硬背”过拟合一次只看一两道题机器容易被个别错题带偏。训练轮数Epochs通俗解释机器把整本练习册从头到尾做多少遍。影响做少了学不会做多了就会变成“做题机器”遇到新题就不会了过拟合。三、 一张图看懂参数 vs 超参数维度参数Parameters超参数Hyperparameters谁来决定机器自己通过反向传播学习人类教练手动设定何时设定训练过程中不断动态改变训练开始前必须提前设定存在哪里保存在模型文件里比如几十 GB保存在代码或配置文件里生活比喻运动员的肌肉记忆和发力习惯教练制定的训练计划、休息时间四、 一句话总结参数是机器在训练中自己摸索出的“内部经验”而超参数是人类在训练前给机器定下的“外部规矩”。AI 训练的一大半工作其实就是人类在不断尝试各种超参数试图找到那个最完美的“教练战术”。

相关新闻

2026年中AI工程十大趋势:从Agent爆发到推理优化的全景复盘
2026/7/4 3:00:45

2026年中AI工程十大趋势:从Agent爆发到推理优化的全景复盘

2026 年已经过半,AI 工程领域的热度不但没有减退,反而在 Agent、推理优化、安全治理等方向上出现了更多值得关注的工程拐点。与 2025 年大模型"百模大战"不同,今年的主战场已经从"谁的模型更强"转向了"谁能把模型真…

阅读更多
影刀RPA新手教程:货拉拉滴滴自动化完全指南——运单数据汇总、费用核算与异常处理
2026/7/4 3:00:45

影刀RPA新手教程:货拉拉滴滴自动化完全指南——运单数据汇总、费用核算与异常处理

影刀RPA新手教程:货拉拉滴滴自动化完全指南——运单数据汇总、费用核算与异常处理 物流公司每天要处理几百上千个运单,货拉拉和滴滴货运的运单数据分散在司机App、商户后台、对账系统里。以前财务人员要手工导出、合并、核算,月底对账加班到…

阅读更多
从零开始学Python开发:三个月入门到实战经验分享
2026/7/4 3:00:45

从零开始学Python开发:三个月入门到实战经验分享

别再幻想着“21天精通Python”这种鬼话了,那都是用来收割你焦虑感的智商税。三个月,从零基础到能独立完成一个像样的实战项目,这不是神话,这需要你褪去所有幻想,用最野蛮、最直接的方式,跟代码死磕。这条路…

阅读更多
Deepseek-V4与Claude-Opus-4.7编程实战对比:谁更懂中国开发者
2026/7/4 5:00:45

Deepseek-V4与Claude-Opus-4.7编程实战对比:谁更懂中国开发者

1. 项目概述:这不是一场参数竞赛,而是一次真实编码场景的“压力测试”最近两周,我连续在三个不同复杂度的真实项目中交叉使用Deepseek-V4和Claude-Opus-4.7,不是跑 benchmark,不是比 token 速度,而是把它们…

阅读更多
第167章 公开(墨子)
2026/7/4 5:00:45

第167章 公开(墨子)

Raft协议作为分布式共识领域的工业标准,其领导者选举、日志复制和安全性保证等核心机制已被广泛验证。在标准实现中,节点状态机、任期号、日志条目(含索引、任期和数据)、心跳维持等基础构件均有规范定义,因此不同实现…

阅读更多
5步打造专属漫画浏览体验:E-Viewer高效使用指南
2026/7/4 5:00:45

5步打造专属漫画浏览体验:E-Viewer高效使用指南

5步打造专属漫画浏览体验:E-Viewer高效使用指南 作为Windows平台备受欢迎的UWP应用,E-Viewer为漫画爱好者提供了一站式的e-hentai.org浏览解决方案。这款开源工具不仅界面美观,还支持多语言切换和个性化配置,让你轻松探索海量同人…

阅读更多
【dnd-kit】react前端做一个可以垂直拖动的无序列表
2026/7/4 5:00:45

【dnd-kit】react前端做一个可以垂直拖动的无序列表

背景和效果 需要做一个垂直拖动的无序列表。因项目中其他模块已经使用了 dnd-kit , 为保持一致,使用的也是 dnd-kit。效果如下: 可拖拽列表示例资料 React生态中主流拖拽库的深度对比与选型指南 选型决策矩阵 代码 import React, { useState } from r…

阅读更多
国产大模型选型误区:别选参数,要选适配水温
2026/7/4 5:00:45

国产大模型选型误区:别选参数,要选适配水温

1. 为什么“选模型”这件事,从一开始就想错了?你点开这篇文章,大概率正被一个问题反复折磨:GLM-5、Kimi 2.5、Minimax M2.5、千问、豆包、通义千帆……国产大模型名字多得像奶茶店新品,参数榜单刷得比朋友圈还勤&#…

阅读更多
“希尔排序”是什么呢?什么原理?怎么用?有什么优势?
2026/7/4 4:00:45

“希尔排序”是什么呢?什么原理?怎么用?有什么优势?

一、为什么会有希尔排序? 在希尔排序诞生之前(1959年),主流简单排序(冒泡、选择、插入)的时间复杂度均为 O(n)。计算机科学家发现了一个痛点: 插入排序在数据基本有序时效率极高,可…

阅读更多
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告
2026/7/3 19:49:14

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

阅读更多
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?
2026/7/3 2:39:23

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

阅读更多
Axure RP中文界面终极解决方案:3分钟告别英文困扰
2026/7/4 0:00:44

Axure RP中文界面终极解决方案:3分钟告别英文困扰

Axure RP中文界面终极解决方案:3分钟告别英文困扰 【免费下载链接】axure-cn Chinese language file for Axure RP. Axure RP 简体中文语言包。支持 Axure 11、10、9。不定期更新。 项目地址: https://gitcode.com/gh_mirrors/ax/axure-cn 还在为Axure RP的英…

阅读更多
STM32F745VG与MC6470 IMU的高性能姿态控制系统设计
2026/7/4 0:00:44

STM32F745VG与MC6470 IMU的高性能姿态控制系统设计

1. MC6470与STM32F745VG的黄金组合解析在工业自动化和机器人控制领域,传感器与微控制器的协同工作能力直接决定了系统的响应速度和定位精度。MC6470作为一款6自由度惯性测量单元(6DOF IMU),与STM32F745VG这款基于ARM Cortex-M7内核的高性能微控制器组合&…

阅读更多
本地部署SAM Audio音频语义分割模型完整指南
2026/7/4 0:00:44

本地部署SAM Audio音频语义分割模型完整指南

1. 项目概述:为什么要在本地跑 SAM Audio?这不只是“能用”,而是“必须用”SAM Audio——全称是 Segment Anything Model for Audio,不是 Meta 那个视觉领域的 SAM(Segment Anything Model)的简单移植&…

阅读更多
基于Dify与DeepSeek构建私有知识库问答系统实战指南
2026/7/3 2:40:23

基于Dify与DeepSeek构建私有知识库问答系统实战指南

在业务中快速构建一个能理解私有文档、准确回答专业问题的智能助手,是很多开发团队面临的共同挑战。传统方案往往需要从零开始搭建复杂的 RAG(检索增强生成)系统,涉及文档解析、向量化、检索、大模型调用等多个环节,整…

阅读更多
FAE放射组学分析工具:医学影像特征探索的完整解决方案
2026/7/3 4:59:02

FAE放射组学分析工具:医学影像特征探索的完整解决方案

FAE放射组学分析工具:医学影像特征探索的完整解决方案 【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE 你是否曾经面对海量医学影像数据感到无从下手?想要从CT、MRI等影像中提取有价值的定量特征&#…

阅读更多
DesktopNaotu:你的终极离线思维导图解决方案,告别网络依赖!
2026/7/3 11:08:19

DesktopNaotu:你的终极离线思维导图解决方案,告别网络依赖!

DesktopNaotu:你的终极离线思维导图解决方案,告别网络依赖! 【免费下载链接】DesktopNaotu 桌面版脑图 (百度脑图离线版,思维导图) 跨平台支持 Windows/Linux/Mac OS. (A cross-platform multilingual Mind Map Tool) 项目地址:…

阅读更多