Hypothesis

188 Matching Annotations

Mar 2017
exacity.github.io exacity.github.io

近似推断

47
1. caszhang 14 Mar 2017
  
  in Public
  
  这些相互作用产生于一个潜变量与另一个潜变量或者当V-结构的子节点可观察时与更长的激活路径相连
  
  产生这些相互作用可能是因为潜变量间直接相连，也可能是因为观察某V-结构的子节点时，它们通过更长的激活路径相连
2. caszhang 13 Mar 2017
  
  in Public
  
  并不是
  
  通常不是
3. caszhang 13 Mar 2017
  
  in Public
  
  交替迭代最小化JJJ分别关于HH\MH和WW\MW的方式
  
  交替地关于H和W做最小化
4. caszhang 13 Mar 2017
  
  in Public
  
  拼在一起并且记为HH\MH
  
  拼成矩阵$\MH$
5. caszhang 13 Mar 2017
  
  in Public
  
  似然函数的对数
  
  对数似然
6. caszhang 13 Mar 2017
  
  in Public
  
  复杂性
  
  难处理性
7. caszhang 13 Mar 2017
  
  in Public
  
  并不是高斯
  
  并不服从高斯分布
8. caszhang 13 Mar 2017
  
  in Public
  
  模型是高斯
  
  是高斯模型
9. caszhang 13 Mar 2017
  
  in Public
  
  加上了鼓励稀疏的先验知识
  
  加入诱导稀疏性(sparsity-inducing)的先验
10. caszhang 13 Mar 2017
  
  in Public
  
  在稀疏编码模型中，它起到了关键作用
  
  它主要用于稀疏编码模型
11. caszhang 13 Mar 2017
  
  in Public
  
  解释
  
  证明
12. caszhang 13 Mar 2017
  
  in Public
  
  是无效的
  
  是无意义的（vacuously true“空真”）
13. caszhang 13 Mar 2017
  
  in Public
  
  如果我们希望能够最大化L(v,h,q)L(v,h,q)\CalL(\Vv,\Vh,q)，那么我们可以把\,MAP\,推断看成是输出一个qqq值的学习过程
  
  如果我们希望设计一个最大化L(v,h,q)的学习过程，那么把MAP推断视作一个给出q值的过程则很有帮助
14. caszhang 13 Mar 2017
  
  in Public
  
  MAP\,推断并不是
  
  我们通常不视MAP推断为
15. caszhang 13 Mar 2017
  
  in Public
  
  一个最有可能的潜变量值
  
  未知变量的最可能值
16. caszhang 13 Mar 2017
  
  in Public
  
  大量
  
  很多不同
17. caszhang 13 Mar 2017
  
  in Public
  
  的单一路径
  
  做单遍(single-pass)传递（论文原文：The algorithm learns a separate “recognition” model that is used to quickly initialize, in a single bottom-up pass, the values of the latent variables in all hidden layers. We show that using such a recognition model, followed by a combined top-down and bottom-up pass, it is possible to efficiently learn a good generative model of high-dimensional highly-structured sensory input.）
18. caszhang 13 Mar 2017
  
  in Public
  
  的第二个特质
  
  带来的这第二个见解
19. caszhang 13 Mar 2017
  
  in Public
  
  在最优大\,M步更新中很难得到一个简单的解
  
  很难求解最优的大M步更新
20. caszhang 13 Mar 2017
  
  in Public
  
  在最优大\,M步更新中很难得到一个简单的解
  
  很难求解最优的大M步更新
21. caszhang 13 Mar 2017
  
  in Public
  
  另一个关键的性质
  
  带来的另一个见解
22. caszhang 13 Mar 2017
  
  in Public
  
  还包含一些不同的解释
  
  带给我们几个见解
23. caszhang 13 Mar 2017
  
  in Public
  
  也利用了相同的性质
  
  也有这种特点
24. caszhang 13 Mar 2017
  
  in Public
  
  这种特定的性质并不仅仅适用于\,EM\,算法
  
  这点并不是EM算法独有的
25. caszhang 13 Mar 2017
  
  in Public
  
  学习过程的一个基本思路就是
  
  它包含了学习过程的基本框架
26. caszhang 13 Mar 2017
  
  in Public
  
  即使
  
  尽管
27. caszhang 13 Mar 2017
  
  in Public
  
  最大化关于θθ\Vtheta的
  
  关于$\theta$最大化
28. caszhang 13 Mar 2017
  
  in Public
  
  M
  
  M（最大化）
29. caszhang 13 Mar 2017
  
  in Public
  
  E
  
  E（期望）
30. caszhang 13 Mar 2017
  
  in Public
  
  使用并不彻底的优化方法来使得优化的过程更加高效（却更粗略），但是优化的结果是不完美的，因为只能显著地提升LL\CalL而无法彻底地最大化LL\CalL。
  
  使用并不彻底的优化方法来使得优化的过程更加高效（却更粗略），不求彻底地最大化L，而只要显著地提升L。
31. caszhang 13 Mar 2017
  
  in Public
  
  简单
  
  方便
32. caszhang 13 Mar 2017
  
  in Public
  
  概率对数
  
  对数概率
33. caszhang 13 Mar 2017
  
  in Public
  
  。因为
  
  且
34. caszhang 13 Mar 2017
  
  in Public
  
  如果我们选择条件概率分布来引入相对于图结构描述的额外的独立性这种情况也是可能出现的。
  
  如果我们选择条件概率分布来引入图结构描述的之外的独立性就可能出现这种情况。【这句话是接着上一句话说的】
35. caszhang 13 Mar 2017
  
  in Public
  
  可
  
  被
36. caszhang 13 Mar 2017
  
  in Public
  
  一个深度玻尔兹曼机，被分层从而使得不存在层内连接
  
  一个深度玻尔兹曼机，变量分为若干层，且不存在层内连接
37. caszhang 13 Mar 2017
  
  in Public
  
  存在大量潜变量的团
  
  存在包含大量潜变量的团（有歧义）
38. caszhang 13 Mar 2017
  
  in Public
  
  通常很难
  
  会难以
39. caszhang 13 Mar 2017
  
  in Public
  
  概率对数
  
  对数概率
40. caszhang 13 Mar 2017
  
  in Public
  
  许多难以利用观察值进行精确推断的问题往往可以描述为一个优化问题
  
  精确推断问题可以描述为一个优化问题，有许多方法正是由此解决了推断的困难
41. caszhang 13 Mar 2017
  
  in Public
  
  推断是一个优化问题
  
  把推断视作优化问题
42. caszhang 13 Mar 2017
  
  in Public
  
  如何将这些技巧应用到训练其他方法难以奏效的概率模型
  
  因有了这些训练技巧才变得易于处理的概率模型
43. caszhang 12 Mar 2017
  
  in Public
  
  同一个可见变量的共同祖先之间
  
  某个可见变量的多个祖先之间
44. caszhang 12 Mar 2017
  
  in Public
  
  基本的
  
  删去
45. caszhang 12 Mar 2017
  
  in Public
  
  一层
  
  一个隐藏层
46. caszhang 12 Mar 2017
  
  in Public
  
  最大似然估计
  
  最大似然参数学习
47. caszhang 12 Mar 2017
  
  in Public
  
  难以推断的原因在于
  
  推断困难通常是指
Visit annotations in context

Annotators

caszhang

URL

exacity.github.io/deeplearningbook-chinese/Chapter19_approximate_inference/
exacity.github.io exacity.github.io

蒙特卡罗方法

132
1. caszhang 12 Mar 2017
  
  in Public
  
  研究者
  
  从业者
2. caszhang 12 Mar 2017
  
  in Public
  
  降低
  
  减小
3. caszhang 12 Mar 2017
  
  in Public
  
  通常使得对sss的估计出现了典型的估计不足，很难被整体的估计过量抵消
  
  这样一来，我们会常常欠估计$s$，而能将之抵消的严重过估计却很少发生【注：这两个分句分别对应着前面两种情况，gross应作“严重的”解】
4. caszhang 11 Mar 2017
  
  in Public
  
  在于他们经常混合得很糟糕
  
  在于马尔可夫链的混合通常不理想【句子有歧义，不是混合MCMC methods】
5. caszhang 11 Mar 2017
  
  in Public
  
  其对应的权值却会非常大
  
  相应的比值会非常大【注：指p(x)f(x)/q(x)】
6. caszhang 11 Mar 2017
  
  in Public
  
  另一方面，当q(x(i))≪p(x(i))|f(x(i))|q(x(i))≪p(x(i))|f(x(i))|q(\Vx^{(i)})\ll p(\Vx^{(i)}) \vert f(\Vx^{(i)})\vert 的时候，样本会很少被采到
  
  另一种相对少见的情况是[EQUATION]
7. caszhang 11 Mar 2017
  
  in Public
  
  随机量的错误
  
  大小不定的误差
8. caszhang 11 Mar 2017
  
  in Public
  
  随机量错误
  
  不定大小误差
9. caszhang 11 Mar 2017
  
  in Public
  
  和
  
  或
10. caszhang 11 Mar 2017
  
  in Public
  
  和
  
  或
11. caszhang 11 Mar 2017
  
  in Public
  
  给定他们所有的邻居结点只要一些变量是条件独立的，那么这些变量可以被同时采样
  
  如果某些变量在给定相邻变量时是条件独立的，那么它们可以被同时采样
12. caszhang 11 Mar 2017
  
  in Public
  
  的
  
  地
13. caszhang 11 Mar 2017
  
  in Public
  
  除非当nnn渐进性地趋近于∞∞\infty时，方程~\eq?的分母会收敛到1
  
  只有$n\to\infty$，17.14式的分母趋于$1$时才渐近成立等号
  
  （注意渐近的近是远近的近）
14. caszhang 11 Mar 2017
  
  in Public
  
  最基础的
  
  最重要的
15. caszhang 11 Mar 2017
  
  in Public
  
  也是最好的
  
  也常常是最好的
16. caszhang 11 Mar 2017
  
  in Public
  
  技巧
  
  方法
17. caszhang 11 Mar 2017
  
  in Public
  
  混合得更快
  
  在模间混合得更快（漏译between modes）
18. caszhang 11 Mar 2017
  
  in Public
  
  模糊
  
  小
19. caszhang 11 Mar 2017
  
  in Public
  
  比如说实验中的类别
  
  实验中是不同的类别
20. caszhang 11 Mar 2017
  
  in Public
  
  值得指出的是，这些方法往往利用
  
  或许可以说(It can be argued that...)，这是因为利用了
21. caszhang 11 Mar 2017
  
  in Public
  
  从单位温度的分布中重新开始
  
  继续在单位温度的分布中采样
22. caszhang 11 Mar 2017
  
  in Public
  
  初始
  
  会暂时
23. caszhang 11 Mar 2017
  
  in Public
  
  区域
  
  构型【注：作者在涉及energy的地方回归物理学用了configuration一词，可译为“能量构型”；其实和state指的是一回事】
24. caszhang 11 Mar 2017
  
  in Public
  
  状态
  
  构型
25. caszhang 11 Mar 2017
  
  in Public
  
  然而，我们利用了其他温度
  
  但我们也可以利用其他的温度
26. caszhang 11 Mar 2017
  
  in Public
  
  在统计物理中反映了基于能量的模型的本质
  
  反映出基于能量的模型的统计物理学起源
27. caszhang 11 Mar 2017
  
  in Public
  
  截止目前，我们已经描述了一个基于能量的模型的概率分布的定义
  
  此前，我们一直以概率分布定义基于能量的模型
28. caszhang 11 Mar 2017
  
  in Public
  
  基于构造一个不同的概率分布
  
  构造一个概率分布替代目标分布
29. caszhang 11 Mar 2017
  
  in Public
  
  所有这些问题可以使MCMC方法不那么有用
  
  这些问题就使MCMC方法变得不那么有用了
30. caszhang 11 Mar 2017
  
  in Public
  
  但是对于吉布斯链来说从分布的一个峰值转移到另一个仍然是很困难的，比如说改变数字
  
  但是想让吉布斯链从分布的一个模转移到另一个（比如通过改变数字）仍然是很困难的
31. caszhang 11 Mar 2017
  
  in Public
  
  有着
  
  要有
32. caszhang 11 Mar 2017
  
  in Public
  
  可以
  
  【是】可以
33. caszhang 11 Mar 2017
  
  in Public
  
  几个这样的转移是很艰难的
  
  某几个这样的转移难以完成
34. caszhang 11 Mar 2017
  
  in Public
  
  代价是很昂贵的
  
  开销很高【注：指的是计算开销】
35. caszhang 11 Mar 2017
  
  in Public
  
  地
  
  的
36. caszhang 11 Mar 2017
  
  in Public
  
  地
  
  的
37. caszhang 11 Mar 2017
  
  in Public
  
  而是需要
  
  更
38. caszhang 11 Mar 2017
  
  in Public
  
  不能仅仅
  
  不仅
39. caszhang 11 Mar 2017
  
  in Public
  
  两个变量取一样的符号的概率几乎相等
  
  两个变量取这两种符号的可能性相等
40. caszhang 11 Mar 2017
  
  in Public
  
  bbb取到1
  
  b也取到1
41. caszhang 11 Mar 2017
  
  in Public
  
  给定bb\RSb时的条件分布
  
  b的条件分布
42. caszhang 11 Mar 2017
  
  in Public
  
  二元
  
  二值
43. caszhang 11 Mar 2017
  
  in Public
  
  跨越
  
  进入
44. caszhang 11 Mar 2017
  
  in Public
  
  所有的分布马尔可夫链
  
  运行的马尔可夫链
45. caszhang 11 Mar 2017
  
  in Public
  
  严重的问题
  
  the problem arises，没有“严重的”
46. caszhang 11 Mar 2017
  
  in Public
  
  当目标分布有很多峰值并且以很高的概率被低概率区域所分割
  
  当目标分布包含很多被低概率区域分割的高概率模
47. caszhang 11 Mar 2017
  
  in Public
  
  峰值
  
  模，下同
48. caszhang 11 Mar 2017
  
  in Public
  
  峰值
  
  模(最频值，mode)，见《模式分类》P78/472
49. caszhang 11 Mar 2017
  
  in Public
  
  相连的
  
  连通的
50. caszhang 11 Mar 2017
  
  in Public
  
  随机变量被采样
  
  被采样的随机变量
51. caszhang 11 Mar 2017
  
  in Public
  
  等效的
  
  可删去，前面已经翻译出“等价于”了
52. caszhang 11 Mar 2017
  
  in Public
  
  马尔可夫链以正比于不同区域对应概率的概率访问这些区域
  
  马尔可夫链会按概率大小访问许多不同区域
53. caszhang 11 Mar 2017
  
  in Public
  
  情景下
  
  领域中
54. caszhang 11 Mar 2017
  
  in Public
  
  他们
  
  它们
55. caszhang 11 Mar 2017
  
  in Public
  
  给定可见单元
  
  给定全部可见单元
56. caszhang 11 Mar 2017
  
  in Public
  
  然后从pmodelpmodelp_{\text{model}}中该点关于在无向图GG\CalG（定义了基于能量的模型结构）中邻接点的条件分布中抽样
  
  记模型结构的无向图表示为G，然后从p_model中该点关于G中其邻接点的条件分布中抽样
57. caszhang 11 Mar 2017
  
  in Public
  
  如何确定一个有效的q(x)q(x)q(\Vx)分布
  
  如何确定分布$q(\Vx)$是有效的
58. caszhang 11 Mar 2017
  
  in Public
  
  决定
  
  判断
59. caszhang 11 Mar 2017
  
  in Public
  
  这些
  
  包括以上在内的诸多
60. caszhang 11 Mar 2017
  
  in Public
  
  通常不能
  
  不能真的
61. caszhang 11 Mar 2017
  
  in Public
  
  消除潜在因素的干扰
  
  减少时延(latency)
62. caszhang 11 Mar 2017
  
  in Public
  
  完全无关
  
  足够无关
63. caszhang 11 Mar 2017
  
  in Public
  
  马尔可夫链在计算上是非常昂贵的
  
  马尔可夫链的计算开销很大
64. caszhang 11 Mar 2017
  
  in Public
  
  存在强烈的相关性
  
  高度相关
65. caszhang 11 Mar 2017
  
  in Public
  
  包括了
  
  包括了XXX的操作/需要XXX
66. caszhang 11 Mar 2017
  
  in Public
  
  固定点
  
  不动点
67. caszhang 11 Mar 2017
  
  in Public
  
  固定点
  
  不动点
68. caszhang 11 Mar 2017
  
  in Public
  
  会简要地
  
  很快会(shortly)
69. caszhang 11 Mar 2017
  
  in Public
  
  之后的采样过程
  
  再重复转移采样过程
70. caszhang 11 Mar 2017
  
  in Public
  
  静止点
  
  稳定点
71. caszhang 11 Mar 2017
  
  in Public
  
  是实数且大小为1
  
  是实数$1$
72. caszhang 11 Mar 2017
  
  in Public
  
  对于
  
  如果对于
73. caszhang 11 Mar 2017
  
  in Public
  
  关于AA\MA的指数变化
  
  求$\MA$的幂
74. caszhang 11 Mar 2017
  
  in Public
  
  不同个
  
  不同的？
75. caszhang 11 Mar 2017
  
  in Public
  
  重新写成
  
  改写
76. caszhang 11 Mar 2017
  
  in Public
  
  根据状态为整数的设定
  
  利用我们的整数值参数
77. caszhang 11 Mar 2017
  
  in Public
  
  不同马尔可夫链的所有状态都会被某一个分布q(t)(x)q(t)(x)q^{(t)}(x)采到
  
  各条马尔可夫链的状态都是从某个分布q(t)(x)中采到的
78. caszhang 11 Mar 2017
  
  in Public
  
  我们将这种状态
  
  此时我们可以把状态简单
79. caszhang 11 Mar 2017
  
  in Public
  
  重定义这个问题
  
  改换参数表示这一问题
80. caszhang 11 Mar 2017
  
  in Public
  
  状态
  
  值
81. caszhang 11 Mar 2017
  
  in Public
  
  我们根据拓扑顺序采样每一个变量，给定每个变量的所有父结点的条件下，这个变量是确定能够被采样的
  
  我们按拓扑序，在父结点给定的条件下依次采样各个变量（可以保证，这时父结点已经被采样过了）。
82. caszhang 11 Mar 2017
  
  in Public
  
  以一个任意状态的点xx\Vx作为起始点
  
  从某个可取任意值的状态$\Vx$出发
83. caszhang 11 Mar 2017
  
  in Public
  
  然而往往又不存在一种
  
  “一种”后加上“易处理的方法来”【漏译tractable method】
84. caszhang 11 Mar 2017
  
  in Public
  
  最方便的目标分布的表达是从基于能量的模型即p(x)∝exp(−E(x))p(x)∝exp⁡(−E(x))p(\Vx)\propto \exp(-E(\Vx))中采样
  
  介绍这些方法最方便的表述是从基于能量的模型即p(x)∝exp(−E(x))中采样
85. caszhang 11 Mar 2017
  
  in Public
  
  通过
  
  可以
86. caszhang 11 Mar 2017
  
  in Public
  
  单路径
  
  单遍(single-pass)
87. caszhang 11 Mar 2017
  
  in Public
  
  原始采样
  
  建议：“原始采样”似乎没有体现出ancestral一词的含义，建议译为祖先采样
88. caszhang 11 Mar 2017
  
  in Public
  
  难以解释的
  
  难处理的(intractable)
89. caszhang 11 Mar 2017
  
  in Public
  
  记作p(a,b)
  
  记其给出的分布为$p(a,b)$
90. caszhang 11 Mar 2017
  
  in Public
  
  应用于所有基于能量的模型的通用理论保证是很常见的
  
  我们通常依赖于那些对所有基于能量的模型都能自然成立的、最一般的理论保证
91. caszhang 11 Mar 2017
  
  in Public
  
  具体分析证明
  
  逐一加以证明
92. caszhang 11 Mar 2017
  
  in Public
  
  最标准，最一般的要求是只适用模型分布处处不为000的情况
  
  最标准、最一般的理论保证只适用于那些各状态概率均不为零的模型【注：theoretical guarantee的意思类似于correctness proof】
93. caszhang 11 Mar 2017
  
  in Public
  
  事实上MCMC方法可以被广泛地应用在了许多包含概率为000的状态的概率分布中
  
  事实上，MCMC方法的适用范围比这要广，许多包含零概率状态的分布也可以用
94. caszhang 11 Mar 2017
  
  in Public
  
  EBM
  
  EBM表述
95. caszhang 11 Mar 2017
  
  in Public
  
  算法
  
  方法
96. caszhang 11 Mar 2017
  
  in Public
  
  算法
  
  方法
97. caszhang 11 Mar 2017
  
  in Public
  
  算法
  
  方法（前后统一）
98. caszhang 11 Mar 2017
  
  in Public
  
  分布pmodel(x)pmodel(x)p_{\text{model}}(\RVx)往往表达成一个无向模型
  
  这种情况通常发生在$p_{\text{model}}(\RV x)$表示为无向图模型时
99. caszhang 11 Mar 2017
  
  in Public
  
  尤其是针对于分类器模型的训练中一小部分错误分类样本产生的代价函数
  
  尤其是分类器这样的模型，其中代价函数主要由少量错误分类的样本产生
100. caszhang 11 Mar 2017
  
  in Public
  
  似然函数的对数
  
  对数似然
101. caszhang 11 Mar 2017
  
  in Public
  
  具有大规模
  
  包含大量
102. caszhang 11 Mar 2017
  
  in Public
  
  通常
  
  有可能
103. caszhang 11 Mar 2017
  
  in Public
  
  这些
  
  这种
104. caszhang 11 Mar 2017
  
  in Public
  
  权值之和很小或趋于零
  
  加数很小或者为零
105. caszhang 11 Mar 2017
  
  in Public
  
  于
  
  与？
106. caszhang 11 Mar 2017
  
  in Public
  
  并且无法
  
  而不足以
107. caszhang 11 Mar 2017
  
  in Public
  
  估计
  
  估计量
108. caszhang 11 Mar 2017
  
  in Public
  
  尽管一个好的qqq分布的选择可以显著地提高蒙特卡罗估计的效率，反之一个糟糕的qqq分布选择则会使效率更糟糕
  
  一个好的$q$分布的选择可以显著地提高蒙特卡罗估计的效率，而一个糟糕的$q$分布选择却会使效率大幅下降（语句不通）
109. caszhang 11 Mar 2017
  
  in Public
  
  这种估计
  
  这一估计量
110. caszhang 11 Mar 2017
  
  in Public
  
  渐进性无偏
  
  渐近无偏
111. caszhang 11 Mar 2017
  
  in Public
  
  这种估计
  
  这一估计量
112. caszhang 11 Mar 2017
  
  in Public
  
  降低
  
  减小
113. caszhang 11 Mar 2017
  
  in Public
  
  得到一个期望上正确的值的
  
  能得到正确期望的
114. caszhang 11 Mar 2017
  
  in Public
  
  所有的问题
  
  原问题
115. caszhang 11 Mar 2017
  
  in Public
  
  对
  
  可能对(can be)
116. caszhang 11 Mar 2017
  
  in Public
  
  估计值
  
  估计量
117. caszhang 11 Mar 2017
  
  in Public
  
  估计
  
  估计量
118. caszhang 11 Mar 2017
  
  in Public
  
  估计
  
  估计量
  
  （本章许多estimator都被翻译成了估计，这是不准确的）
119. caszhang 11 Mar 2017
  
  in Public
  
  从\eqn?所示的关系中可以发现
  
  由等式\eqref{}可得
120. caszhang 11 Mar 2017
  
  in Public
  
  通常
  
  删去
121. caszhang 11 Mar 2017
  
  in Public
  
  从衡量一定采样数所达到精度的角度说
  
  如果考虑达到某给定精度所需要的样本数
122. caszhang 11 Mar 2017
  
  in Public
  
  通常
  
  总（可以不译出）
123. caszhang 11 Mar 2017
  
  in Public
  
  存在不唯一
  
  不存在唯一
124. caszhang 11 Mar 2017
  
  in Public
  
  使用一个趋近于目标分布估计的序列
  
  找出一列收敛于目标分布的估计量
125. caszhang 11 Mar 2017
  
  in Public
  
  累积密度函数
  
  累积分布函数
126. caszhang 11 Mar 2017
  
  in Public
  
  估计
  
  估计量
127. caszhang 11 Mar 2017
  
  in Public
  
  计算无偏估计的方差时，更倾向于用计算偏差平方和除以n−1n−1n-1而非nnn。
  
  我们更倾向于用方差的无偏估计，它由偏差的平方和除以$n-1$而非$n$得到
128. caszhang 11 Mar 2017
  
  in Public
  
  这种近似可以被证明拥有如下几个性质
  
  下面几个性质表明了这种近似的合理性
129. caszhang 11 Mar 2017
  
  in Public
  
  在其他情况下
  
  还有些时候
130. caszhang 11 Mar 2017
  
  in Public
  
  如
  
  或
131. caszhang 11 Mar 2017
  
  in Public
  
  发布一个失败报告
  
  报告求解失败
132. caszhang 11 Mar 2017
  
  in Public
  
  通常
  
  总是
Visit annotations in context

Annotators

caszhang

URL

exacity.github.io/deeplearningbook-chinese/Chapter17_monte_carlo_methods/
exacity.github.io exacity.github.io

深度前馈网络

9
1. caszhang 11 Mar 2017
  
  in Public
  
  封闭形式
  
  闭式
2. caszhang 11 Mar 2017
  
  in Public
  
  为了对在整个训练集上的表现进行评估，
  
  评估整个训练集上表现的
3. caszhang 11 Mar 2017
  
  in Public
  
  前馈网络充分发挥作用的一个简单例子
  
  一个可以完整工作的前馈网络
4. caszhang 11 Mar 2017
  
  in Public
  
  其中包括不同领域的（如语音识别或计算机视觉）专家以及不同领域间微小的迁移(transfer)。%此处难道是没有迁移吗
  
  语音识别和计算机视觉等不同领域的从业者需要专门进行研究，而领域之间的迁移很少
5. caszhang 11 Mar 2017
  
  in Public
  
  并没有将足够的先验信息进行编码
  
  包含的先验信息不足
6. caszhang 11 Mar 2017
  
  in Public
  
  平滑
  
  函数一般叫“光滑”
7. caszhang 11 Mar 2017
  
  in Public
  
  封闭形式
  
  通过闭式
8. caszhang 11 Mar 2017
  
  in Public
  
  观测
  
  neuroscience应该叫观察好些吧，天文叫观测。。
9. caszhang 11 Mar 2017
  
  in Public
  
  自然语言
  
  翻译成“自然语言处理”是否好些
Visit annotations in context

Annotators

caszhang

URL

exacity.github.io/deeplearningbook-chinese/Chapter6_deep_feedforward_networks/

Annotators

URL

Annotators

URL

Annotators

URL