OVH detect attack Internet avec Spark.
Il y a une config par default pour SparkContext. (combien d’excuteurs, etc.)
一个在大学任教的前辈说,当他用R的随机森林处理一个相对大一点的dataset时,程序就出错了,用来描述R开源代码的健壮性欠缺。此时隔壁的前辈说,哈那是因为你没有用Gboost呀,GBoost是他从kaggle学来的经验之谈。于是我随手找来一个GBoost介绍 http://www.360doc.com/content/16/0822/21/35786273_585178927.shtml
顺便被安利了一个pyspark的教学文档: http://tutoriels-data-mining.blogspot.fr/2016/05/programmation-python-sous-spark-avec.html
近日被同事嫌弃代码风格,反思和到处找文档和参考意见,开始用pycharm debug,顺便看到一篇经验文: http://www.techug.com/post/secret-of-no-bug-development.html