杂:简单尝试了deepseek-R1的看法
好久没有写新文章同步了。一来最近项目很忙很少有时间,二来写文章好像也没有多少流量和可能的收益,个人动力也就有限了。 近些年来科技发展的很快,从最早的生成式图片到现在的生成式大模型,世界越来越变成了我想象不到的样子。从2023年openai的gpt3出现到目前的国产百花齐放,国外几只独秀,再到国内的deepseek独占鳌头风头一时无两。真的是时间瞬息万变慢慢的超过了我的进度。 国内的各种模型都有自己独到的特色,我尝试过自建GLM3-13B,他的在线生成代码效果让我感觉很是新奇。不过在长久的使用下我也是慢慢了了解了其局限性和使用能力边界。很长时间我都在使用ChatGLM系列并且完成了很多的原本不熟悉的工作(比如写一个脚本、写一个basic之类的)基本上能节省这些时间大概提升了我10~30倍的效率。 直到最近的deepseek出现。