2019-05-31
Generalized Zero- and Few-Shot Learning via Aligned Variational Autoencoders

本文主要是介绍了一种使用变分自动编码机来解决GZSL中的泛化问题,相对于现行的许多方法有独特的优点。首先,交叉重建的设计思路非常的巧妙;其次,相对于同为生成模型的GAN,VAE的训练过程相对稳定很多;更重要的是,本文使用了一种相对很soft的生成目标,即解决了VAE相对于GAN更初级的问题,也让softmax分类成为了可能。

Read More
 2019-04-04
Zero-Shot Learning Through Cross-Modal Transfer

本文主要的贡献在于将传统的零次学习拓展到了广义零次学习(GZSL),即在测试阶段所面对的数据可能属于已见类别或未见类别,而不是仅仅属于未见类别,是GZSL的提出文章。而这样做的关键在处理怎样区分已见类别和未见类别上(因为如果不区分的话那么已见类别一定会过拟合而未见类别一定会欠拟合),本文给出了两种淳朴的基于outlier的方法。

Read More
 2019-03-07
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

本文提出了一种非常有趣的方法来解决一般的分类模型输入大小必须固定的问题--SPP层。这种层的构建方式中蕴含的思想是非常有趣的,根本上是一种对感受野大小做文章的方法,它通过不同大小的pooling使最终能获得很多感受野大小不同的输出。这种思想后来被广泛的用在Semantic Segmentation等多个需要不同大小的感受野的任务中。

Read More
 2019-03-05
CS229学习笔记

转行起始阶段的学习资料,CS229的详细笔记,多是机器学习的最基本的知识,其中很多内容非常数学而又点到为止,当时学习的时候由于时间紧迫更多的是跟随课程一样点到为止,到后来的学习实践过程中才发现其中的很多内容都是很有必要深入探究的,尤其是其数学本质以及推导过程。虽然现在有说法是越需要人进行数学推导的方法其效果越差,但是在研究的过程中,数学的基础还是起到了相当大的作用的,尤其是在non-trivial的改进方法探究以及最新的研究方向的探索初期等阶段。

Read More
 2019-03-05
CS231n学习笔记

转行起始阶段的学习资料,CS231n的详细笔记,多是卷积神经网络的基础知识,但后面的部分和实际研究中使用的东西已经很接近了,多是某一个特定领域的前沿研究中最基础的部分,在进入某个领域的时候还是很有翻阅的必要的。

Read More
 2019-03-05
CS229学习笔记

转行起始阶段的学习资料,CS229的详细笔记,多是机器学习的最基本的知识,其中很多内容非常数学而又点到为止,当时学习的时候由于时间紧迫更多的是跟随课程一样点到为止,到后来的学习实践过程中才发现其中的很多内容都是很有必要深入探究的,尤其是其数学本质以及推导过程。虽然现在有说法是越需要人进行数学推导的方法其效果越差,但是在研究的过程中,数学的基础还是起到了相当大的作用的,尤其是在non-trivial的改进方法探究以及最新的研究方向的探索初期等阶段。

Read More
 2019-03-05
CS231n学习笔记

转行起始阶段的学习资料,CS231n的详细笔记,多是卷积神经网络的基础知识,但后面的部分和实际研究中使用的东西已经很接近了,多是某一个特定领域的前沿研究中最基础的部分,在进入某个领域的时候还是很有翻阅的必要的。

Read More
 2019-05-31
Generalized Zero- and Few-Shot Learning via Aligned Variational Autoencoders

本文主要是介绍了一种使用变分自动编码机来解决GZSL中的泛化问题,相对于现行的许多方法有独特的优点。首先,交叉重建的设计思路非常的巧妙;其次,相对于同为生成模型的GAN,VAE的训练过程相对稳定很多;更重要的是,本文使用了一种相对很soft的生成目标,即解决了VAE相对于GAN更初级的问题,也让softmax分类成为了可能。

Read More
 2019-04-04
Zero-Shot Learning Through Cross-Modal Transfer

本文主要的贡献在于将传统的零次学习拓展到了广义零次学习(GZSL),即在测试阶段所面对的数据可能属于已见类别或未见类别,而不是仅仅属于未见类别,是GZSL的提出文章。而这样做的关键在处理怎样区分已见类别和未见类别上(因为如果不区分的话那么已见类别一定会过拟合而未见类别一定会欠拟合),本文给出了两种淳朴的基于outlier的方法。

Read More
 2019-03-07
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

本文提出了一种非常有趣的方法来解决一般的分类模型输入大小必须固定的问题--SPP层。这种层的构建方式中蕴含的思想是非常有趣的,根本上是一种对感受野大小做文章的方法,它通过不同大小的pooling使最终能获得很多感受野大小不同的输出。这种思想后来被广泛的用在Semantic Segmentation等多个需要不同大小的感受野的任务中。

Read More