“倒也不是报错,程序是能调得通的,就是跑不到原论文中叙述的效果,愁死了啊。”
“跑不到不也没关系么,你的数据集是你们师门自己搞的,跟原论文用到的数据集都不一样,尽量调就好,跑不到不是太正常了么。”
在计算机行业,数据集绝对是基础中的基础,实验效果好不好,数据集质量高不高是关键。
一份经过高质量预处理的数据集很可能使你的实验效果事半功倍,所以很多计算机专业的研究生在做实验时尽量会选择原作者公开的数据集,这样自己只需要专注编写自己的程序就可以了。
很多研究生凭借着这样的便利一口气发表了多篇论文,早早攒足了毕业条件。
然而还有一部分研究生走上了一条荆棘的道路,他们的研究领域并没有公开的数据集,甚至有的研究领域是个新兴领域,连怎么研究都还没有确定的路数,更别提数据集。
这种情况下研究生就需要自己采集自己的数据集,并且还要预处理,工作量之大是常人难以想象的。
很不幸,凌志和陈峰的研究方向都属于后者。