某风险投资招聘笔试问卷

本帖是某基金招聘笔试问卷的回答,由于问题比较有价值,自己也的确经过了一些思考,故整理成文。

(此公司真的是梦中情司,不管是从招聘推文还是历史推送还是任何互联网资料来看,都充满了深深的人文关怀以及深度的思考。 完全无法拒绝这样的气质,个人认为能从中学到不少东西以及发挥自己的作用。 几个星期过去了,还无法摆脱对他的喜爱,仍在其历史推送中学习。)

(距离提交已经一个星期了,许愿有机会能够进入这样的公司,并和几位有趣的创始人共事。)

问题一

问题

在商业上你有什么独特的观察或思考角度,请列举3个并解释。(请在表达清晰的前提上控制字数)

注:请不要仅仅列举你的角度,还要尽量给出背后的思考逻辑以及触动你获得这个视角的基础信息(下同)。这个观察或思考角度可以是对某个人群的行为洞察、某个零售业态的商品结构组合、某个公司/行业危机征兆等、关于产品的设计(比如某个增加用户粘性的产品功能设计、或者feed流的排序逻辑改进)、某个组织管理架构方式(比如这个组织是否高效、汇报线和权责划分方式跟成员的激励/动机)

回答

由大到小,我们从以下三个层面分析:行业层面,产品层面,用户层面。

行业层面:如何思考什么行业可能有较大的机会?以问题为导向思考。

  • 什么是机会?机会通常指当下没有但是未来会有的方向和需求。预测未来是一件十分困难的事情,不管是预测技术、产业、还是社会变革(存在微观上的自由)。相对而言,预测什么问题或许能在不久的将来得到解决比较容易(存在宏观上的必然)。举个例子,寒武纪的创始人曾经跟我们说过,他创立寒武纪前期进行了以下分析“人工智能这件事似乎是一个真命题,那么如果它发展起来的话,社会需要什么?那么我们认为至少需要高效的计算单元”。从需求或潜在需求为导向思考,或许是最正确的方式。
  • 什么不是机会?我们可以判断这个行业是否(即将)解决了一个社会的大需求,且没有带来太大的负面影响。举个例子,之前的社区团购,它想解决的似乎是“菜市场/便利店到小区楼下这一公里的问题”,于是首先进行大量补贴抢占市场。这个需求是否足够大有待商榷,因为买菜以有多种解决方案(包括家里的闲人买菜,顺路买菜,周期性囤菜)。此外社区团购带来了一定社会意义上的负面作用(违背了商业向善),即通过低价倾销,使得个体户菜贩等弱势群体收到了损失。即媒体所说的“科技公司不应该和菜市场阿姨抢生意”【4】。所以从“理想、愿景、使命感、社会责任的角度来讲”,一门好的生意,或许世俗意义上应当有着较好的愿景。

产品层面:思考何谓护城河?护城河是设计角度出发的产品自我强化的能力。

  • 产品自我强化的能力是护城河,即随着产品的使用,在某项重要指标上得以自然而然地提升。“用户,品牌,平台”等等仅仅是这一能力的外在表现。该能力因行业而异,例如奢侈品就是宣传效应,模型就是准确率,社区就是繁荣共创程度。举例来看,当前绝大多数的AI产品没有护城河,基于且仅基于prompt的应用,没有任何的不可替代性以及自我强化能力。
  • 如何得到自我强化能力?我们认为需要精心的设计。举几个例子,midjourney的优质图片选择反馈(即你需要在四张图中选一张),抖音的操作反馈(即点赞收藏评论和浏览时长)。这种反馈会在技术上或者用户体验上累积优化,并用于提升产品效用,这一循环难以被打破。这些流程是由很优秀的产品经理配合产品特性设计出的。一个另外的例子,ChatGPT并没有一种类似的反馈(反馈很弱),所以似乎这也是他们发力建造插件仓库的原因之一,即通过开发者在另一个方向自我强化(卷起来)建立护城河。

用户层面:思考用户有什么普遍特性?这里我们仅讨论其中的标签文化,即大家乐于给自己打标签,并以此参与社会消费娱乐活动。

  • 是否存在?个人通过浅层的观察,可以举一些或宽或窄的例子,“麦门信徒”【1】,“i人e人(MBTI)”【2】,“星座”,”社畜“,”狗粉丝“【3】等等。源头上来讲,这些与商业行为或相关或无关,或来源于社会阶层,或来源于社会讨论,并且很多人会“骄傲”“坦诚”的自称自己从属于某一标签。但不论来源,人们乐意给自己贴标签这件事似乎是普遍存在的。
  • 为何存在?个人认为主要原因之一或许是人对归属感的强烈需求。当然此处未经深度调研,或许是一个有趣的话题。
  • 存在于哪里?个人认为并不适用于一些低链接人类(线上线下社会联系较为松弛)。这里同样未经深度探索,也是一个值得思考的问题。
  • 如何利用?从商业上来说即考虑如何通过这一现象变现。这可能在深度调研之后才会有答案。凭借目前的理解,或许利用标签进行社群活动,吸引潜在产品投放广告或许是一个最粗浅的方式。此处还需要有更深更全面的思考。

Reference

  1. https://www.sohu.com/a/645096673_120153933
  2. https://www.16personalities.com/free-personality-test
  3. https://www.huxiu.com/article/364840.html
  4. https://zhuanlan.zhihu.com/p/336849579

问题二

问题

有什么商业问题、经济问题、历史问题、学科问题或其他问题是过去半年到一年一直困扰你的,你的思考路径和阶段性的结论是什么(不一定要完全解决这个问题)?

回答

近一年,由于科研、论文、找工作、毕业等许多场景交织,有着较多烦恼。在去年12月ChatGPT发布之后,我的多种烦恼似乎汇聚到了一起,变成了一个大问题,即“通用人工智能(AGI)好像要来了,作为大半个从业者(同为AI方向的研究),我在这个浪潮中会处于怎么样的一个位置?

首先将问题具体化。假设“我仍旧会在AI方向从业深耕”,那我好奇“一个强大的 AGI,他能做什么(以前做不到的事)?”目前什么叫做 AGI似乎也没有一个定论,wiki【1】也没有一个十分准确的定义,那我们此处将其认为“有着搜索,学习,知识表示,外加一定通用问题解决能力,外加自然语言能力的Agent。”但是我们发现,这个定义似乎仍然没有那么清晰。

进一步细化问题,AGI在当下似乎一定程度上可以与ChatGPT这种类大语言模型(LLM)的效果等价(在不考虑物理实体以及交互质量的情况下)。那么我们的问题再次简化为“LLM究竟到底能做什么以前做不到的事?以及我可以在其中扮演什么角色?”至此,我们的问题已经十分的具体,那么我们可以尝试回答。

探究第一个小问题,“LLM”是什么?这是一种基于Transformer架构的(通常是decoder为基础的)神经网络,以概率分布为输出而得到下一个“token”。那么本质上来说,它似乎好像和有限状态机【2】这种状态转移的模型(在状态足够多的情况下)没有太大区别。但是在表现上来说,它带来了惊人的生成(状态转移)效果。而有限状态机因为基于图结构,无法容纳过多的状态,所以无法达到文本生成的目的。

探究第二个小问题,现在我们可以讨论一个LLM能干什么以前做不到的事。从直观效果上来看,其“文本生成”基于其广阔的训练数据,其效果似乎极其优异,那么作为“智能客服”或者“智能文秘”,或许已经十分适用,能达到先前无法企及的表现。但这一分析流于表面,我们或许可以分析其本质上从社会角度带来的不同。我们认为 LLM 可以近似的当成一个黑盒的具有少量内存的“大脑”(当然会有很多功能缺失,例如其他感官能力)。那么在未来算力以及模型升级的情况下,“大量廉价的具备一定信息处理生成能力的大脑”可以作为已经构建好的基础设施。

探究第三个小问题,有了这些有数量规模的“大脑”,我们可以做什么。似乎就是“信息生成”以及“信息处理”两方面。“信息生成”,即AIGC,已经被大量谈论到了,甚至已经造成了一定程度的互联网污染,我们不在这一方面展开。但是“信息处理”似乎没有很多地被深度谈及到。那么基于LLM的信息处理相较于其他的信息处理有什么区别呢?作为“脑”来说,对于非结构化信息的处理比较擅长,不论是少量深度非结构化数据(AI论文梗概),还是批量浅度非结构化数据(平台上AI情绪分析)。似乎这个推论比较显然,但是并没有看到太多这方面的,非简单调用prompt的工作。或许需要深入思考一下为什么。

目前的结论:在此情况下,对于基于强非结构化数据的需求来说,(批量化)LLM应该算是一个很强的解决方案。那么或许我可以在这一方面做一些细微的工作,当然这个需求是什么,这类数据是什么,或许还需要深入的调研。目前我并没有一个很清晰的结论。

Reference

  1. https://zh.wikipedia.org/wiki/通用人工智慧
  2. https://zh.wikipedia.org/wiki/有限状态机

问题三

问题

列举你最后看的3本书(按时间倒序),请给出书名、开始看的时间、是否看完了、是否推荐。挑选其中1本描述它给你的关键启发。

回答

今年过于忙碌,并没有沉浸式读书(仅偶尔翻书),时间上最近的认真读的书也要追溯到去年。由于自己平时有记录读书笔记的习惯,所以也比较好整理本问题。(读书笔记请见:https://www.superui.cc/categories/reading-note/)

按顺序来说从近到远三本书为

  • 《罪与罚》,约2022-10开始读,到2022-11读完。十分推荐,认为适合所有读者。
  • 《论个人在历史上的作用问题》,于2022-08阅读完毕,很薄的一本书,印象中或许只用了一两天读完。推荐,但是仅推荐给对哲学问题较为感兴趣的朋友(读懂或许需要很多的社会阅历以及深度思考,个人并没有读很懂)。
  • 《浪潮之巅》,约2022-05开始读,到2022-07读完。这是我第二次读这本书,目的是回顾当代信息技术发展的脉络(并思考个人职业规划)。对于想要了解现代科技史以及对商业感兴趣的朋友十分推荐。

在此介绍《罪与罚》这本书以及其对我的关键启发。本书是俄国著名作家陀思妥耶夫斯基的代表作之一,称得上是世界文学巨作。我阅读本书的原因首先是久仰大名(在我的待读列表中躺尸很久),其次是罗翔老师总是在各种场合多多少少的提到这本书,让人心生好奇。在三本书中,本书或许是最通俗易懂的,但是它引起的思考足够震撼。

先简要介绍故事,这本小说从第三人称视角讲述了一个青年犯罪者拉斯科尔尼科夫杀人以及之后内心挣扎,并最终到警局自首的事件。在这个较为简单的故事线下,复杂之处在于主人公及其丰富且细致的“内心活动”。在第三者的视角,我们可以清晰的看到他认为自己作为不寻常人实施犯罪的“自我逻辑”,再到他的事后惊恐慌张带来的强烈“心理生理反应”,再到他内心的平静慌张痛苦的“多种心态交织”,再到最后他自首进入监狱获得了重生。

在此我们选取一个视角来描述其对我关键启发。个人认为最有趣的点在于拉斯科尔尼科夫的观点“有的天才,有权跨越法律或道德界限”,这也是他实施杀人的理论支柱。此处抛开法律,抛开“什么是天才”,我从中看到了一种强烈的“自我”特性。即以“我”为中心,“我”有权定义且影响整个社会。作为读者,我认为这是一个很普遍的现象,甚至我自己也会有一些这样的毛病(尽力改正中)。这个现象或许会带来两类后果,一是以自我为中心会带来强烈的自大感,感性上来看这种自大会严重影响与周围人的交往关系,即缺乏尊重。二是,理性上来看,这种自大会导致对外界的排斥,沉浸在自己的小世界,使得与客观真相越来越远。这两方面都会对个人的发展带来极其严重的消极影响。所以这本书又一次让我认识到,“以自我为中心”的危害。

问题四

问题

(选填)你是否投资二级市场(A股、港股、美股均可)?若有请列举最近投资或正在关注的3个公司,并选取其中1家阐述投资逻辑。

回答

我有进行A股,美股的“炒股”行为,目前并算不上严格意义的投资,或许称为投机更准确(因为并没有通过大量交互形成一个很强的逻辑体系)。目前主要的行为可以看做个人对某行业和股票技术上的所见所想的验证,本人把这个交互过程看作一个“消费”过程。

三个目前关注的公司:寒武纪(AI芯片),理想(新能源汽车),新希望(生猪养殖)

下面我来阐述寒武纪这家公司的投资逻辑,从行业,技术,产品+竞品,客户,风险层面讨论出发,目前对该公司的总体看法谨慎乐观。

关键词:AI计算需求,国产替代,(较国内同行)先发优势。

概况

这是一家AI芯片制造公司,有着成熟的产品。于2020年在科创版上市,发行首周最高价接近300元,之后的两年股价阴跌,最低到了50元之下,直到2022年中开始横盘,并于2022年12月开始拉升,在2023年4月一度回到了270元的高位,目前处于高位震荡的情况。目前公司未有盈利,总市值约780亿。

行业方面分析

创始人(目前是董事长)陈天石教授在很早的时候做了宏观的分析猜想,即“在人工智能这个真命题下,我们认为至少需要高效的计算单元”。随着人工智能的发展(搜索,学习,知识表示),这一猜想已被证实。可以说未来这个行业会成为基础设施般的存在,在以数据驱动的社会中,以及无法绕过。此处我们有较为正面的结论。

技术实力分析

公司的创始团队来源于中科大以及中科院,陈天石教授在博士期间研究人工智能领域的演化算法方向,是2011年CCF优秀博士论文奖获得者。创始人团队在近五六年多次向我们进行技术讲座,让我们了解到了该公司的创业史。单从技术而言,寒武纪团队在2014年就开始就研发AI专用加速芯片,开发了一套独立的底层指令集以及AI计算通用架构,并多年在ISCA(国际处理器架构年会)上获得同行评议得分第一【1】。此外,Google TPU技术论文也多次引用到了寒武纪团队的论文【2】,这里其实已经可以体现出其团队的不俗技术实力以及先发优势。由于本人并没有深入了解AI处理器的技术架构,技术实力的分析仅到此。此处我们有较为正面的结论。

产品以及竞品分析

公司目前在做云端的智能加速卡(用于AI训练推理,通用型较弱,但是能效较高),并持续推出成熟产品。寒武纪主营在AI芯片,并无通用型的GPU产品。其还未正式发布的产品思源590【3】号称接近A100的水平。竞品方面没有深入研究,华为海思、地平线、燧原科技、昆仑芯等都有相关产品,但是从当前视角来看,似乎没有质的区别。但是这一大类国产产品(甚至可以说除了英伟达之外的所有产品),用户端社区效应差,目前没有出现英伟达Cuda般的生态,所以大规模受学界业界认可还任重道远。此处我们评价谨慎乐观。

客户分析

目前的客户主要是政府(珠海合作项目)以及一些大厂(阿里云浪潮曙光)【6】。政府采购应当会持续,因为难以购入海外产品。大厂由于成本限制,在已经解决需求的情况下似乎也会倾向购买性价比更高的产品。这个角度来看,在产品能稳定出货,且产品力不大幅下降的情况下,我们保持谨慎乐观。

潜在风险

在2022年底被加入美国实体清单【4】,面临缓存断供,七纳米制程设计无法找台积电代工,EDA工具无法使用更新等风险。所以在制裁下大规模出货可能性有限【5】。但是或许可以代理找台积电生产【6】。在此方面,我们持谨慎态度。

总结

从行业,产品,客户,风险上来看,我们对公司的发展持谨慎乐观态度,目前其发展的负面因素在其他的国内竞品公司上也都有存在,所以或许分析整个行业会比较合理。此外,我并未从财务方面对公司进行估值,在当前价格下,考虑到AI当下投资的过于乐观,个人认为需要注意风险。

Reference:

  1. https://mp.weixin.qq.com/s/1Gzig2lgJGyt0BwwpZ3oZA
  2. Jouppi, Norman P., et al. “In-datacenter performance analysis of a tensor processing unit.” Proceedings of the 44th annual international symposium on computer architecture. 2017.
  3. https://www.fxbaogao.com/detail/3620830
  4. https://finance.sina.com.cn/chanjing/gsnews/2022-12-16/doc-imxwvwhx6670147.shtml
  5. https://www.51cto.com/article/758076.html
  6. https://xueqiu.com/6347482150/246397389

问题五

问题

(选填)假设你获得了3000万人民币创业资金,可以自己组建团队创业,简单介绍你首选和次选的产品和商业模式,并说明理由。注意:请不要仅仅描述你的计划,而同时描述你的关键选择背后的独特观察,如果做过相应的事实收集工作,也请进行描述。

回答

首选产品

行业:“量化自我”

即个人行为模式的复制建模,对应大家对“自我了解”、“经验归纳”以及未来可能存在的“在线自我”的需求。这是一个长期存在的需求。举例,一个高产出画师作画规则的量化分析,一个高质量研究员研究套路的量化分析,基金经理行为决策的模式分析,自我做决定时的原理探索分析。这个是大模型出现之前无法解决的,因为人能提供的是是高度非结构化的数据,在当前时间节点,大模型至少提供了一种量化方式。

产品

  • 动机:或许受限于技术,也受限于真实人类数据,我们此处将场景限定在一个很小的范围,即“基于对话的自我认知系统” 。这个对应到的观察是,“很多人其实并不知道自己要什么”,举一个例子,“很多产品经理都无法表述出其最后想要一个什么样的产品,输入输出是什么”,那么我们其实可以在一定规则下,探究用户的思维,帮他挖掘构建逻辑树。在面向普通个人之外,本产品可以应用到具体的行业,比如产品设计和咨询,可以将经验性事项流程化规模化。
  • 产品形态:具体来说我们想要的效果是,输入一个具体的话题或决策目标,通过多轮次基于选择的对话,输出一个逻辑树来帮助用户分析问题(并将逻辑树生成一个初步的文本结果)。

事实搜集

  • 需求逻辑方面并未进行事实搜集。
  • 相关产品,目前发现少量相关工作。
  • 浙大本科生团队数字孪生【1】,其产品形态与我们的切入点极其不同,他们目前是做了一个虚拟宠物形态的模拟。但是从愿景上看,个人认为有着极大的相似。

商业模式

  • 用户:面向企业用户,作为某种能力培训辅助系统。
  • 收费方式:订阅收费,类SaaS。
  • 护城河(先产品模式再技术)
    • 模式上:
      • 在相似问题/领域上经验累积,可以提升该专业方向的交互质量。
      • 交互过程中隐式对人的模仿,可以完成数据飞轮下的产品迭代
  • 技术设计上:
    • 一种在交互使用中,提升“逻辑树的构建模式、下轮沟通会话构建、问题泛化能力”的技术设计。

备注: 首选此项目的原因是该项目天花板更高。初步的产品未必需要3000万资金来推动。目前提到的自我认知系统最核心的部分是问题分解能力。初步的问题分解能力构建成本或许较低,但是日后“解构问题能力”的升级,或许会需要较大的数据和算力开销。

次选产品

行业:历史数据库

即历史的数据抽象装载。对应大家对历史经验的探求需求,和以史为镜的参考价值。目前没有听说过这个行业(至少没有听过和见过数字化的此行业),或许因为在此前这一需求难以实现,而大模型为此非结构化数据分析提供了可能。

产品形态: 输入某一件具体时点的事件(配合该时点的其他信息),输出一个历史中的相关时点信息以及相似度分析。

商业模式

  • 用户:面向企业。主要用户为政府机构,金融公司,以及大量研究者。
  • 收费方式:类似Bloomberg。
  • 护城河(先产品模式再技术)
    • 模式上:
      • 本地留存收集构建的大量高质量数据。
      • 用户查询的统计价值探索,即用户更在意什么。我们可以挖掘为什么,并精细化产品。
      • 数据上的持续更新迭代能力。
    • 技术上:
      • 时间节点以及历史事件切片向量化方式
      • 强大的数据库来做嵌入和检索。

备注: 该项目可能资金消耗较大,因为数据的采集以及清洗修补会耗费大量的资源人力。但是一旦建成产品,短时间内或许有着较高的竞争壁垒。

Reference

  1. https://www.xiaohongshu.com/explore/649bbee8000000001303d12f

某风险投资招聘笔试问卷
https://blog.superui.cc/writing/xvc/
作者
Superui
发布于
2023年7月11日
许可协议