Introduction

自从知道了Github Pages和Hexo这对绝佳搭配之后,一直心心念念地想做一个自己的独立博客。虽然从阅读量来说,肯定还是在CSDN、简书或者知乎专栏发布会有更多被阅读的机会,但总感觉或多或少地有些阻碍,不能随心所欲地写作。之前倒是一直把Github当作一个博客,天天把markdown写的笔记contribute到仓库里面,不过鉴于Github支持的是源生的markdown,而markdown本身是不支持latex公式的,所以多少有点遗憾。Anyway,终于用Github Pages+Hexo搭建了这个博客,有MathJax和七牛图床的支持,终于可以随心所欲地写作了~

鉴于大四一直在忙自己的项目和论文,所以少有时间做些真正原创的技术分享,前期主要打算在这个博客做一些阅读笔记。暑假一直在读周志华博士写的《机器学习》一书,把本科生课程部分(书的前半部分)的笔记基本都整理好了,放在了Github上面,但这显然是不够的,想做研究当然还是得往更深的技术里钻,所以书的后半部分还要继续细读精读。另一方面,这本书比较新,所以习题部分目前网上还没有比较好的解答。书中的公式有些比较复杂,对工程人员来说理解可能有不少困难,所以我也希望可以用课余的时间认真地把这本书的习题过一遍,如何对公式进行向量化,如何融入到实际的项目中,用代码进行实现。希望可以分享出来,为开源做点贡献,为其他书友带来一点帮助,自己应该也会有不少的收获。之后会逐渐把笔记和解答迁移到这个博客里,需要花费的时间也比较多,不过贵在坚持。

因为个人研究方向主攻数据挖掘的推荐系统领域,所以阅读的书籍和文章也比较多涉及这个方面。而中文书籍中,个人认为推荐系统领域最好的一本入门书籍是项亮的《推荐系统实践》,之后也会在这个博客中更新阅读这本书的笔记。另外也会搬运一些机器学习和数据挖掘比较好的文章到这个博客中,加入一些自己的理解,算是记录自己成长的轨迹吧,虽然不是技术原创,但在阅读和学习的过程中,记录下自己的见解,以后再看也会有很大的帮助。

另外,我个人也非常喜欢Python这门编程语言,在数据科学方面的研究中,Python是一个不可多得的利器,所以要是遇到好的Python相关的文章,也会收录到这个博客中。再有就是linux和Hadoop、Spark方面的一些笔记了,要做大数据总是免不了碰到这些东西。虽然工具年年变,说不定以后Spark就不像现在这么火了,但是好的工具总是有研究价值的,好好学的话还是会有不错的收获。

最后,也是一点小寄望吧,希望以后可以能逐渐有多一些技术原创,多一些项目分享,目前就先脚踏实地地积累知识吧。

以上。

坚持技术分享,您的支持将鼓励我继续创作!