王沛的博客 | WANGPEI's Blog

人脸识别原理(以GitHub项目face_recognition为例)

Face Recognition based on DNN

主流人脸识别的原理(以GitHub项目face_recognition为例) GitHub项目地址face_recognition 该项目目前star数超过3万，是GitHub上最主流的人脸识别工具包之一。Face_recognition主要参考了OpenFace项目以及谷歌的facenet。其主页的介绍如下：本项目是世界上最简洁的人脸识别库，你可以使用Python和命令行工具提...

Posted by 王沛 on December 22, 2019

目标检测经典算法总结(R-CNN, Fast R-CNN, Faster R-CNN, YOLO)

Including brief overview of R-CNN, Fast R-CNN, Faster R-CNN and YOLO.

目标检测经典算法总结原手稿在这里 pdf 1. R-CNN：从原图像中提取2000个候选区域。2000个候选区域由选择性搜索(selective search)算法产生。选择性搜索：（1）首先初始化多个候选区域；（2）用贪心算法递归地将相似区域合并成较大区域；（3）使用生成的区域去产生最终候选区域建议；检测过程如上图所示：将2000个候选区域分...

Posted by 王沛 on December 15, 2019

文献总结《You Only Look Once：Unified, Real-Time Object Detection》

YOLO：统一、实时的目标检测

《You Only Look Once: Unified, Real-Time Object Detection》原文链接在这里 pdf 这是Joseph Redmon等人于发表于CVPR 2016的一篇关于目标检测的文献，提出了目标检测领域经典的YOLO模型，一种端到端的实时目标检测方法。 1. 主要内容：将目标检测任务作为一个回归问题，而不像先前的方法那样改造分类器用来识...

Posted by 王沛 on November 3, 2019

文献总结《Learning Spatio-Temporal Features with Two-Stream Deep 3D CNNs for Lipreading》

使用双流深度三维卷积神经网络学习唇语的时空特征

《Learning Spatio-Temporal Features with Two-Stream Deep 3D CNNs for Lipreading》原文链接在这里 pdf 这是Xinshuo Weng等人于2019年发表于BMVC的一篇关于唇语识别的文献，提出了使用双流3D卷积神经网络进行唇语的时空特征提取。 1. 主要内容：使用双流输入的深度3D CNN模型进行前...

Posted by 王沛 on August 10, 2019

文献总结《Multimodal Gesture Recognition Using 3-D Convolution and Convolutional LSTM》

使用3D卷积和卷积LSTM进行多模手势识别

《Learning Spatiotemporal Features with 3D Convolutional Networks》原文链接在这里 pdf 这是G. Zhu等人于2017年发表于IEEE ACCESS的一篇关于深度学习用于手势识别的文献，提出了3D卷积神经网络与卷积LSTM的结合使用，进行时空特征提取。 1. 主要内容：提出了一个多模手势识别，基于3D卷积以及c...

Posted by 王沛 on May 12, 2019

文献总结《Learning Spatiotemporal Features using 3DCNN and Convolutional LSTM for Gesture Recognition》

使用3D卷积和卷积LSTM学习时空特征用于手势识别

《Learning Spatiotemporal Features with 3D Convolutional Networks》原文链接在这里 pdf 这是G. Zhu等人于2017年发表于ICCV的一篇关于深度学习用于手势识别的文献，提出了3D卷积神经网络与卷积LSTM的结合使用，进行时空特征提取。 1. 主要内容：提出了新的深度神经网络从而学习时空特征，用作手势识别； ...

Posted by 王沛 on May 12, 2019

文献总结《Deep Residual Learning for Image Recognition》(附TensorFlow代码)

图像识别的深度残差学习

《Deep Residual Learning for Image Recognition》原文链接在这里 pdf 我的TensorFlow版本的代码在这里这是Kaiming He等人于2015年发表于CVPR的一篇关于深层卷积神经网络用于图像识别的文献，第一次提出了Residual Network (残差网络),即著名的ResNet。 1. 主要内容：提出了一个残差学...

Posted by 王沛 on April 24, 2019

文献总结《Learning Spatiotemporal Features with 3D Convolutional Networks》(附TensorFlow代码)

使用3D卷积神经网络学习时空特征

《Learning Spatiotemporal Features with 3D Convolutional Networks》原文链接在这里 pdf 代码在这里这是Du Tran于2014年发表于CVPR的一篇关于深度学习用于动作识别的文献，第一次提出了 C3D Model,即三维卷积神经网络。 1. 主要内容：展示3D卷积网络优于2D网络，可以同步地对动作和特征建...

Posted by 王沛 on April 21, 2019

搭建个人博客教程(基于github pages和jekyll)

The simplest way of building a personal website based on github pages and jekyll

前言这是目前为止最简单的搭建个人网站的方法。效果如下，点击王沛的主页访问： Github Pages的出现，使得搭建个人静态网站变得更加容易，省去了租用服务器的麻烦，事实上，Github给用户提供了免费的服务器。本文就是基于Github Pages建立的个人网站。 jekyll是一种将纯文本转换成静态网站的工具(软件)，它的使用方法再官网上有详细介绍,本文将介绍基本配置方法，省...