BTC 牛市币股代币化股票山寨币稳定币 Robinhood AI Agent 空投监管 SEC 特朗普

赵长鹏押注华人大三学生，1100万美元做教育Agent

Founder Park

作者：Founder Park

原标题：赵长鹏投了一个华人大三学生，1100 万美元种子轮，做教育 Agent

华人大三学生，1100 万美元种子轮，硅谷学生创业目前融资最高产品。

主打一句话即可生成个人专属教学/讲解视频，面向 K12 的教育 Agent 产品 VideoTutor，今日宣布完成种子轮 1100 万美元融资。本轮融资由 YZi Labs领投，百度风投、锦秋基金、Amino Capital、BridgeOne Capital 以及多位知名投资人联合参投。

这也是 YZi Labs 投资的首家 AI产品公司。

创始人 Kai Zhao（赵凯）表示，VideoTutor 获得了赵长鹏及 YZi Labs 投资团队的认可与支持，并最终由 YZi Labs 领投本轮融资。他们拿到了 10 多个 TS（投资意向书），最终选择了这几家。

5 月 14 日上线第一版产品（在 Founder Park 产品市集首发），得到了市场的认可与 PMF 的验证，不到 5 个月的时间，完成了这笔 1100 万美元的种子轮融资。

在 Kai 看来，他们能拿到这笔融资的核心原因是：方向正确的前提下，「小天才团队」用可视化学习的方式解决了 K12 赛道的美国高考学习的痛点。

「这个领域比较适合年轻人去做，再加上有非常好的工程化动手能力，以及 founder 本身有非常好的 insight 和经验，执行力非常快。」

不只是他们，Cursor、Mercor、Pika、GPTZero 等等，硅谷的大学生们，正在用一个一个创下融资新高的 AI 产品，刷新大家对于 AI 创业的认知。

AI 时代的创业，真的有些不一样了。

我们跟 VideoTutor 的这些年轻人们聊了聊，想知道为什么他们能拿到这笔种子轮融资，如今的硅谷创业正在发生什么样的变化。以及，为什么他们这么想招国内大厂的员工。

采访嘉宾：CEO Kai Zhao、CTO James Zhan。

采访&编辑｜万户

以下是访谈内容，经 Founder Park 编辑整理。

01 K12 赛道，可视化学习才是真方向

Founder Park：这么多家机构都很看好你们，在你看来，核心是哪个点打动了他们？

Kai：我觉得首先是方向正确，AI 教育这个赛道非常有潜力和前景，我们切入的教育领域是美国高考 SAT、AP。瞄准的用户人群是 K12 的高中生，我们和这个用户人群的 gap 非常小，基本上没有代沟。我们走过整个备考学习周期，知道考试和备考的痛点在哪里，能做出一个真正解决这个人群痛点的产品。

其次，团队非常优秀。James 来自 Gemini，在谷歌就是做 AI 工程和算法的核心工程师。我本人有三次教育创业经历，从大一开始就创业做教育软件，在大二期间参与创建 MathGPTPro 其中项目入选奇绩创坛等。有成功打造教育产品的经历。

第三点，我们做的 AI 教育领域，核心是动画引擎，而我们是 VideoTutor 的核心开发者，是最了解核心技术的团队，能把动画引擎做到十分精准的渲染。

团队本身有非常好的 marketing 基因，知道怎么做传播。

VideoTutor 非常符合美国主流 VC 的一个投资共识，叫「小天才团队」，指的就是这个领域比较适合年轻人去做，再加上有非常好的工程化动手能力，以及 founder 本身有非常好的 insight 和经验，执行力非常快。我觉得这是所有投资人都能看好的一个共识性的原因。

VideoTutor 在 YZi Labs EASY Residency Demo Day 登上纽交所

Founder Park：你们的产品想解决教育里行业的哪个核心问题？

Kai：市面上目前的学习产品，可以归为两类：主动学习产品和被动学习产品。被动学习产品，像字节的 Gauth、Chegg、AnswersAi 等，覆盖了我们称之为「作业解答」（Homework Help）的场景，学习链路非常短，主要是学生付费来做作业解答。

而 VideoTutor 覆盖的是主动学习场景，我们不需要考虑学生的学习动机，因为他们必须要去学习、要去考试，比如美国高考 SAT、AP。在这个场景里，有大量可视化的痛点需求，美国高考 80% 的内容都涉及函数、微积分等需要复杂图像渲染的知识。VideoTutor 的动画引擎就能非常好地解决这个场景。

而且，这个领域的客单价非常高。美国平均每年有 260 万名学生要参加 SAT 考试，付费需求很大。线下的 SAT 课程收费很贵，不是按套餐，而是按小时收费，平均每小时 150 美金起步，大部分收费在 230 美金。很多学生和家长都会付费学习。但是 VideoTutor 能够很好地平移甚至取代老师的培训，因为现阶段 AI 生成的视频和老师培训的内容几乎没区别了。这样一来，学生能以最低的成本拥有一个自己的 AI 个性化备考老师。

Founder Park：你们当时决定做这个产品的契机是什么？

Kai：其实在我们之前，斯坦福已经有个团队做了，叫 Gatekeep Ai。他们当时也想做可视化学习。我当时已经意识到这个方向的影响力了。前几次创业时，大家做的教育产品基本上都是接上 GPT 的 API，类似于一种 ChatGPT Wrapper 的产品。但我们发现，仅仅基于文字问答，这类产品是有天花板的。可以看到，像 Chegg、Gauth 的业务都在下降，很大一部分场景都被 ChatGPT 取代了，因为学生付费 20 美金用 ChatGPT 就能解决很多作业问题。

基于 API 套壳、做优化层面的产品已经到了天花板。

但多模态视觉生成有非常大的前景，因为在美国高考这个领域有非常多可视化学习的场景。可惜 Gatekeep 开了个好头，但没有继续下去，因为它推出得有点早，当时的基础模型编程能力还没成熟，GPT-4 也还没发布。再加上数学动画引擎涉及到渲染和算法，他们没有攻克。但我们团队掌握了动画引擎的所有核心开发，解决了这个问题，让视频渲染非常准确。

02 PMF：用户付费意愿很强

Founder Park：你们当时产品上线后，跟几个学校也达成了合作。在你们看来，是什么时候或者哪个功能让你们觉得「我这个产品做对了，痛点找对了」，感觉自己找到了 PMF？

Kai：可以从三个维度来说。

首先，从营收指标维度，到现在为止 VideoTutor 已经收到了 1000 家企业的 API 请求，包含了美国所有知名的大型教育机构，甚至国内的机构。此外，还有很多学校想要购买服务。C 端用户的意向更直接，有个学生家长，也是个投资人，他体验完产品后，把产品给了所有亲朋好友试用，所有人都愿意付费。然后他不知道从哪拿到了我的电话，给我发短信想要投我们。C 端用户有非常强烈的付费意愿。

第二点，从用户需求层面。为什么美国线下一对一的 Tutor 教育那么刚性？因为家长觉得一对一教学效果好，愿意付这个钱。现在多模态 AI 技术已经能拟人化地做到一对一的教学效果，所问即所答。而且，美国线上一对一教学老师录的视频课，其实跟 AI 生成的视频没区别了。这就是我说的「需求平移」，学生花大价钱买的录播课程，跟我 AI 生成的没区别，那为什么不用 AI 呢？成本更低，教学效果更好。

我们收到了很多学生非常正向的反馈，很多老师也愿意传播这个产品，前期的完播率和使用时长都特别好。我们现在筛选出的 200 个种子用户，都是早期积累的。

第三点，就是一种产品的 taste 和 sense。当你不断地做，从整个教育行业的进步、到学生和家长付费的核心需求点、再到产品自身的进化，倒推回来想，整个逻辑是闭环的。所以从这三个维度来看，你就觉得 PMF 已经足够了。最核心的就是，付费意愿非常非常强。

跟 FIZZ 达成了合作

Founder Park：很多用户主动想付费，也有人主动联系你们想投资。

Kai：对。SAT、AP 这个领域，付费意愿本来就很强。这个领域的客单价都高达 100 到 200 美金起步，线下上课更贵，可能要 800 美金。美国有 260 万名学生要考 SAT，其中 37% 的学生都会主动付费，这是一个付费意愿和需求都非常强的市场。我们的产品能实现非常好的需求平移。

Founder Park： SAT 这个赛道，对考生来说，一个真人老师和一个 AI，他会信任 AI 吗？

Kai：现在 AI 回答像美国高考 SAT、AP 这种水平的问题，基本上不太会出现事实性的错误。在这种情况下，它为什么比线下 tutor 更好？一个是便宜，二个是学生有任何问题都能不断提问，不用担心问了笨问题老师会有看法或者不耐烦，可以 24 小时随时随地学习。

而且这个市场是可以平移的，做完美国市场，我们还可以平移到加拿大、英国的 A-Level 考试等等，付费需求非常大。

Founder Park：付费这块你们现在怎么考虑？

Kai：我们是包月订阅，还有一种是按学习结果付费。我觉得现在 AI 已经可以做到按结果付费了。我们可能会推出一个套餐，比如你付 799 美金，我们保证你的孩子 SAT 数学能考满分。

Founder Park：但是按考试结果付费，不是还要看学生个人的能动性吗？

Kai：这个在国内高考可能做不了，因为高考考核点非常多，有上千个。但美国高考 SAT 只有 62 个考点，其中 50 个是常规考点，大部分学生都没问题，剩下的 12 个考点也基本能掌握。除非这个学生的逻辑水平确实有问题，否则基本不存在学不会的情况。而且 AI 的提效效果非常明显。

其实很多美国在线 tutor 也有这个服务，你付给老师 1800 美金，老师辅导孩子，成功率基本是 100%，因为 SAT 考点是固定的。只要学生智商水平正常，基本都没问题。但高考不行，高考没办法短期内提上来。而且国内高考需要拉开分数差距，会有难题，但美国高考不存在绝对的难题，因为它更多是考察你是否掌握了知识点。

按结果付费也是之前教辅老师已经在用的模式，具备这个前置条件。

Founder Park：那你们的定价里，模型成本会是一个困扰吗？占比高吗？

Kai：我们这个领域的客单价定价非常高，都是 69 美金一个月起步，模型成本现在很便宜，不成问题。教育这个行业不像 coding 领域，大家都在卷价格，因为 coding 需要支持很长的上下文。

03 面向高中生的产品，网页端最重要

Founder Park：记得你上次说，你们第一版的原型差不多只花了两个多月的时间。当时整个开发周期，比如分工、决定做哪些功能、不做哪些功能，是怎么考虑的？

Kai：我们团队所有人的共识就是，迭代要快，因为快才能快速得到早期用户的反馈。

第一个版本在推特上发了之后引起了很大轰动，带来了大量用户。但这些用户里，很多是程序员、投资人或者科技爱好者，我们可以统称为「技术尝鲜者」。在那个阶段，从他们那里得到的反馈比较分散，价值不大。还是要从这么多广泛的用户里，筛选出真正核心的种子用户，也就是高质量的高中生，然后通过咨询的方式获取有用的反馈。

我们得到的核心反馈就是，视频渲染的精确性必须达到 100%，这是需要优化的重中之重。UI 是否好看，或者是否支持不同的 TTS 声色选择这些功能，都被我们砍掉了。回归到产品的核心：我们做的是理科场景的知识学习，那么图形渲染的精确性就是核心。

Founder Park：生成时长当时是怎么取舍的？

Kai：那时候最高的峰值时长大概是 6 分钟。当时的主要考量是，普通题目的讲解和知识点讲解不应该超过 6 分钟。但后续的反馈中，我们发现有些学习能力不是那么好的学生，希望内容讲得慢一点、深入一点。我们意识到时长不应该做限制，更多还是取决于用户的学习能力。

Founder Park：现在最长能到多长时间？

Kai：最长应该在一个小时以内，可以一直打破砂锅问到底。边交流边实时生成，不过这个功能是最近上的，最开始的版本是没有的。

Founder Park：有没有当时想做，后来发现没那么重要就先不做的功能？

Kai：比如说 App。当时觉得是不是要快速开发 App，但后来发现美国大部分学生基本上都是用 Laptop 或者 iPad 学习，美国大部分 K12 学校都会给学生发一台 Chromebook 电脑，电脑高度普及，他们的作业也都是在电脑上完成。高中生基本上人手一台电脑，手机在学习场景的占比不到 5%，比例很低。

Founder Park：所以如果是一款主打教育或者学生群体的产品，网页端是首先要做的，App 反倒没那么重要。

Kai：对，当时其实已经知道这个数据了，毕竟在美国上学多年。后来我们从早期的几万名用户里挖了 100 个学生做调研，这 100 个学生里面 90 多个都有电脑，所以我们更加确信了这一点。

Founder Park：你们上线第一个版本时，也是瞄准 K12 群体来做的吗？

Kai：是的，之后也是瞄准这个群体。我们跟 Gauth 不算竞品，我们更多的是做考试培训场景。美国大量高中生本身就会选择线下培训或者在线学习平台，而 VideoTutor 很好地把这个需求平移了过来。

Founder Park：K12 会是你们起码一年内的核心用户群体吗？

Kai：应该是两年以内的核心指标。

04 用大模型，但不只依靠大模型

Founder Park：简单介绍一下你们现在的技术实现方案吧？VideoTutor 在生成课程、图表这块确实做得比其他视频生成模型好很多，甚至在很多模型连文字都无法准确生成的时候，你们的技术让人很惊喜。

James：我们生成的视频既有文字也有图案。大概的生产流程就是：让大语言模型去生成文字和对应的动画指令，然后动画指令再经过我们的动画引擎渲染，最终呈现在视频上。

文字部分相对简单，我们让大语言模型生成文本，然后直接渲染上去。但动画部分，是我们自己的一个数学动画渲染引擎生成的。它的优点在于渲染坐标轴、几何图形等内容的精确度非常高，而这正是我们的核心技术所在。

现在的大语言模型输出的只是文本，我们做的这套 agent 就相当于给了大语言模型一张纸和一支笔，让它能把它想象中合适的教学动画给画出来。画出来的那一部分，就全是我们的技术了。

Founder Park：整个视频最后的合成，包括音视频，是怎么处理的？

James：一开始用户会传入一个 prompt，比如「什么是勾股定理？」。第一步，我们让大语言模型去推理所有场景，一般会规定 3 到 5 个场景，这取决于问题的难度。然后，模型会为每个场景生成大致的脚本。接着，再根据每个场景的脚本做第二次推理，生成场景中的文字、对应的图案和人声的文本。人声文本再用 TTS 合成。

最后，我们把所有场景拼接起来，组成一个完整的视频。

Founder Park：我理解第一版是这样的方案。现在加入了随时可交互的过程之后，生成过程是不是也有变化了？

James：确实有变化。我们现在为了让用户能最快看到内容，会先生成第一个场景，让用户先看，后面的场景则在后台继续渲染。当用户提出问题时，我们会将他的人声转换为文本，然后把这个文本连同之前所有场景的内容一起交给大语言模型去推理，让它规划接下来的教学场景。后续场景的渲染流程就和之前一样了。

Founder Park：如果用户在听到一分钟时有个问题，他会直接提问。你们收到提问后，就把用户的提问和之前讲过的内容一起返回给模型处理。在这个过程中，用户提问完之后，动画是继续播还是会停下来？

James：我们现在的延迟已经从一开始的二三十秒，压到了 5 秒以内。在交互上，我们会做一些过渡，让用户不会过多地关注这 5 秒，整个过程的衔接会比较丝滑。在 4-5 秒内，他就能看到根据他问题全新呈现的内容。

目前阶段的设计是，AI 老师会说：「嗯，我考虑一下」，然后把黑板一擦，就像真实模拟老师一样。你觉得讲得有问题，那我就擦掉重新给你写一遍，这样的流程会感觉比较自然。

而且我们不只是被动地等待用户提问，中途我们也会做 Quiz。我们会根据 Quiz 的反馈和用户的问题进行推理。而且我们不是完全自由麦，而是需要用户主动打开麦克风，有一个开启和关闭的动作。

Founder Park：所以基于这样的机制，最长大概能生成一个小时的讲解。

James：准确来说是没有限制的，如果他一直有问题，就可以一直问下去。

Kai：对，没有预设限制。其实 VideoTutor 做这个方向，也是随着多模态 AI 的进步，我们并不是在创造需求，而是在更好地满足已有的需求。你看线下的真人教育，为什么美国家长愿意付很贵的钱？因为美国教培行业更多是一对一教学，每小时 100 美金起步。就是因为线下的老师能做到引导式提问，我能观察到你哪里不会，然后接着问你。VideoTutor 也是尽量去实现这种真老师的教学效果，让每个孩子都能做到实时互动、实时教学。

Founder Park：学生上课时，会要求开启摄像头吗？

Kai：不太会。学生是否开摄像头主要取决于美国的隐私法案。产品里面不太会设计强制开启的功能，是否开启取决于学生的意愿。主要的交互还是通过提问和语音反馈。

Founder Park：技术上，你们是采用小模型和云端大模型配合的策略，还是怎么样？

Kai：是一种配合。我们内部有一个数据集，现在已经有超过 10 万多条的视频数据。这些数据中比较好的都会被人工进行二次标注，然后用来训练微调模型。比如我们现有超过 8000 条的 SAT 样本训练数据。这些微调过的小模型会配合云端的通用商用模型像 Claude、Gemini 来做。

Founder Park：用 Claude、Gemini 还是 GPT，会对产品的核心性能有影响吗？

Kai：我们主要涉及 K12 领域，基础模型的水平已经足够了。但为了确保 100% 正确，我们会调用两个模型同时校对，如果两个模型答案一致，那基本就不会出错。在代码生成方面，更多还是以 Claude 为主，它的代码能力比较好。

Founder Park：现在产品的技术瓶颈在哪？是模型能力还是代码生成？

Kai：模型能力是其中一环。还有就是渲染，现在已经攻克到 5 秒以内，随着 GPU 的更多部署还能更快。另外一个就是长期记忆能力。我们需要对学生进行长期的学习行为数据积累，知道这个学生有哪些知识点不懂，比如一个月前学的知识点忘了，可以重新提醒他。

James：我们在渲染时间上其实下了很多功夫，一直在做技术突破，从一开始的 2 分钟到 1 分钟，再到现在的 10 秒以内。我们最终的目标是希望能做到基本没有延迟的渲染，用户一问，推理一结束马上就出结果。这是我们团队目前在攻克的一个难题，但已经找到了新方向。

05 不看完播率，只看最终考试分数

Founder Park：现阶段怎么衡量产品的核心指标？怎么判断一个视频对用户是有用的？

Kai：最核心的一个指标就是考试。在新版本里，你看完视频，结尾会有一个 quiz，做对了就证明你理解了，没做对就证明没讲明白。

学习效果没办法只看完播率，有些学生可能看一半就懂了。在他看一半的时候给他做个测试，通过了，剩下的就不需要看了。我们产品的核心指标，就是看多少学生在这里提高了分数。

Founder Park：但他最终的考试是在别的场景完成的，你们怎么得到他是否通过的这个结果？

Kai：这就要说到美国的产品文化，就是用户使用产品后，得到好的结果，会有一种自发性的分享。很多学生用完 VideoTutor 考完 SAT 后，会主动过来分享他们的使用体验和成绩。我们还会让他们成为校园大使，进行二次传播。

我们有 20 个高中生组成的校园大使。其实你看 Mercor 早期非常成功，用的就是典型的「用户成功故事」模式。Mercor 早期帮很多印度程序员找到了美国的工作，然后他们就会联系这些用户，给他们拍一个 user story，讲怎么用 Mercor 找到工作的。这形成了很好的口碑传播。VideoTutor 也是一个道理，我们要的就是更多学生使用产品后达到非常好的效果，然后把这些学生的经历做成 user story 分享出去。

Founder Park：学生主要分享的渠道是在哪？

Kai：学生主要在 TikTok，家长在 Facebook 的群组里。

Founder Park：如果把时间放到半年或一年的时间维度，你们规划的产品增长方式是怎样的？

Kai：我觉得本质上，VideoTutor 核心还是一个 C 端用户产品，口碑传播非常重要。很多成功的 AI 应用早期都是靠种子用户的口碑，比如设计师用了觉得好，就传播开了。对我们来说，核心指标就是有多少 SAT 考生用了这个产品后考了高分，然后传播给其他孩子和家长。家长主要用 Facebook 和 Instagram，学生用 TikTok，我们会在这些平台上传播。当形成这种共识性的口碑时，学校老师自然而然就会意识到。我们早期能被这么多学校知道，就是因为很多老师用了觉得不错，推荐给了学校的采购负责人。所以，最核心的还是 C 端用户的口碑传播，多少孩子用了之后提高了分数是关键指标。

Founder Park：新版本大概的状态和推出的时间规划是怎样的？

Kai：我们希望最快在两个月以内正式 public release。届时学生能够以很低的延迟做到所问即所答，并且理科场景的图形渲染能做到 100% 准确。当然，我们暂时不会覆盖竞赛场景或者像线性代数这种复杂的大学知识，更多还是覆盖 K12 领域。

Founder Park：VideoTutor 现在的壁垒或者护城河是什么？

Kai：我觉得有几点。第一是数据飞轮。视频背后都是代码，用户生成的好的视频数据，经过二次标注后，就能被重新训练微调模型。越多的数据，视频效果就越好。另外就是学习行为数据，我们知道不同学生哪个知识点薄弱，就能建立起数据飞轮，越多人用，产品就越懂学生。第二是领先的技术优势，比如动画引擎的算法。虽然算法本身不是最核心的优势，但随着我们快速迭代，数据越来越多，优势会更明显。

第三是品牌，VideoTutor 已经在北美家长圈里成为 AI 教育领域的一个头部品牌了，家长的信任度也是一种无形的壁垒。

Founder Park：三到五年后，你预期 VideoTutor 最终会成长成一个什么样的产品？

Kai：我们希望未来 VideoTutor 能成为每个人学习理科知识的 AI 老师。我们只做理科。我觉得未来它会超过多邻国。多邻国是一个世界级的语言学习产品，但在 STEM 理科场景，过去一直没有出现世界级的产品，因为理科需要太多图形渲染。现在基础模型的技术已经 ready 了，所以我觉得理科场景会诞生下一个「多邻国」。

06 招人，尤其想要国内大厂出来的人

Founder Park：你之前有过几次创业经历，大概都是做什么的？

Kai：我现在大三。大一的时候就和 James 一起创业做教育产品，拿了 20 万美金的天使投资。虽然那次失败了，但学到了宝贵的经验：你不能陷入同质化的竞争。当时我们做的 App，市面上有很多同类产品，早期就不得不陷入投流竞争，很难收费。

第二次创业，我是作为联合创始人加入另一个团队 MathGPTPro，待了几个月。在那个阶段，我学到了怎么看产品指标、如何打造产品、怎么做用户扩展。也是在那个时候，我得出一个结论：基于文字类的解答型教育产品已经到头了。因为它和 ChatGPT没什么区别，而且过去像作业帮花很大代价做的结构化知识题库，也被大模型的编辑能力取代了。所以第三次创业，我就知道，可视化是必然的趋势。

赵凯在哈佛大学跟 Sam Altman pitch 的合影

Founder Park：过去的两段经历，除了让你认识到文字类产品的局限，在团队或其他方面，对你现在做 VideoTutor 有什么帮助吗？

Kai：有很大帮助。

第一点，更好地判断方向和产品是否有未来。我会通过看竞品的网站流量、营收，来判断整个产品的进化方向。

第二点，产品打造方面，能更好地判断产品的开发节奏，包括产品设计、前后端对接、要看哪些指标。

第三点，团队管理和组织文化能力。我建立了更完整的管理制度，包括每个同学的分工、奖励和期权发放。还有，也学会了怎么去融资。这一轮 1000 万美金的融资，我们在 20 天以内就完成了。

Founder Park：你们现在团队有多少人？

Kai：6 个人，大家住在一起。

Founder Park：团队最初是怎么搭建起来的？

Kai：我跟 James 已经创业两次了。我们俩都是一个学校毕业的，大一的时候就一起做了一款 App。大二的时候，我跟另外两个人一起创业，大家彼此都认识了。当意识到这个技术能带来非常大的产品愿景时，我们就联系组队来做这个产品。之前大家都是校友，包括团队另一个合伙人 Nick 也是我的大学室友。

Founder Park：你们现在也准备扩招，想招什么样的人？

Kai：我们主要招后端、前端、大语言模型和 UI/UX 方面的，希望是有经验的。因为我们现在已经跨过了试错阶段，进入了产品快速 build 的阶段，需要有经验的人来帮助我们成长。

Founder Park：需要有经验的工程师、产品经理和增长负责人，来把产品从 1 做到 10，甚至从 10 做到 100。

Kai：是的，就是这个阶段。我们预期把团队扩充到 9 到 10 个人，核心还是以招工程师为优先。

这次招的可能会在国内，所以是 in-person 和远程混合的方式。

Founder Park：希望这个人是什么画像的？

Kai：我们更希望他是在一些大厂经历过的，比如字节、美团。因为字节是一个高速、比较卷的组织文化，重视年轻人。在字节训练过的人，有比较好的方法论和能力，加入我们之后能把这些成功的经验带进来，进行融合学习。

想要在国内大厂打过硬仗、有快速迭代经验的人。我们已经度过学生创业阶段了，不太需要招新手，更多需要招一些有经验，但又不是那种完全的「行业老炮」。因为行业老炮可能要顾及家庭，没办法那么卷。所以中间层次的，年轻又能卷的就比较好。

我们愿意给优秀的人才丰富的期权。我们虽然融了 1100 万美金，但为什么没在美国招工程师？就是因为我们觉得国内的产品力和工程能力真的非常好。这一波 100% 会有华人经营的团队打造出伟大的产品，在国际上跑出来。现在很多 AI 应用层面都是华人打造的，国内的工程能力真的很厉害。这也是我们的优势，要利用中美两国之间的优势。

VideoTutor 目前详细招聘需求： https://videotutor.io/

07 硅谷的大学生，都在 AI 创业了

Founder Park：现在尤其是在硅谷，大学生创业的趋势特别明显，你看到的是一个什么样的状态？

Kai：看一个事实，就说这轮百亿美金估值的公司：主打 AI 招聘的 Mercor，已经完成 3 亿多美金的新的融资，估值已经百亿美金；而 Cursor 已经是板上钉钉的 100 亿美金估值。对应的还有像 GPTZero、Pika 等等。这些都是大学生创业项目，尤其是 Cursor 和 Mercor 的创始人都是大三辍学生。

这一波年轻人创业，都有一个特点，就是高度差异化竞争。他们在极其窄的领域里专注去做，没有做通用的东西。比如 Mercor 做 AI 招聘，一开始就只做印度程序员的招募。

第二点是环境。整个硅谷的资本环境和底层创新，像斯坦福、YC、Peter Thiel 的基金，都在最早的阶段支持大学生创业，不管你有没有成熟的想法，都愿意支持你，并且提供强大的人脉网络。

第三点，我觉得是这些大学生的品质。无论是我们，还是硅谷出来的这些大学生，都有非常勇敢的冒险精神和极强的学习能力。这种勇敢闯荡的精神，国内很多学生可能不太具备。因为在硅谷，身边有很多同龄人成功的案例激励着你，资本环境也愿意相信年轻人。

对我来说，当时也对比过成本和收益。如果我选择读完大学再找工作，未必能还得起家里的留学成本，也未必有很大的收益回报。但如果选择创业，我能在最年轻的时候去疯狂学习，我的人生就有无限的可能。我从小就想创立一家伟大的公司。

Founder Park：为什么今天这一代大学生创业能做出百亿美金的公司，而以前可能卖个一两千万美金就算很了不起了？这里面有 AI的热潮和泡沫因素吗？

Kai：我觉得不完全是泡沫。Cursor 有 4.5 亿美金的真实营收，这是很可靠的。这背后，是这一代年轻团队的方法论和认知 insight 非常关键。你看这些团队，背景都挺优秀，他们有非常好的学习能力。

Cursor 早期就是靠身边的大学生程序员，这些人对 AI 接受度高，给了很强的反馈。创始人本身也是个小天才工程师，能深刻理解用户，工程迭代能力强，早期就四个人把产品干起来了。他们把产品迭代好之后，就形成了用户口碑，有了营收，投资人也怕错过下一个 Mark Zuckerberg，所以资本又来助力。

最底层的条件是，AI 这波很多技术是新的，年轻人学习速度快，又务实、靠谱、敢干，所以有极致的用户理解和超快的迭代速度，去击败传统的产品。比如在 Cursor 之前，GitHub Copilot 做得也挺好，但为什么没干过它？就是因为用户体验和执行速度。

Founder Park：是不是可以说，因为 AI是个新技术，所以很多产品认知也需要用新的角度来看？

Kai：对，年轻这一代比上一代创业者有更深的认知见解，能离用户更近。现在主流的 AI 用户都是 00 后了，他们学习和反馈的迭代速度、包容程度，都比上一辈创业者更快。

所以，认知迭代速度是核心。移动互联网时代，技术迭代是以年或者季度为单位的，但 AI 时代，技术迭代可能是以天为单位的。作为 founder，你必须快速学习，而年轻人更能熬夜，更有拼劲。

Founder Park：之前有媒体说硅谷很多创始人也开始 996 了，你们怎么看？

Kai：我身边一些白人创业者朋友，融了很多钱，也 996。他们也跟我们一样，租个大 house，所有人生活在一起办公。我觉得 996 更多是环境所迫，现在硅谷有点像淘金热，大家都不想落后，那就只能比产品迭代速度，必须熬夜快速迭代。这是一种环境塑造，倒逼人必须这么做。

Founder Park：硅谷的这些大学生创业，在赛道选择上有什么趋势吗？

Kai：我觉得无论是我们做教育，还是其他人，大家都有一个趋势，就是在自己的舒适圈里创业。舒适圈指的是你对这个领域和用户足够了解。Cursor 创始人对 coding 非常了解，我们做教育也是因为对这个人群足够了解。现在的年轻人更多是在自己已有的认知舒适圈里创业，不再贸然跳到一个不了解的领域。因为这样你获得的用户的反馈才足够快、足够正确。

还有认知叠加。我们三次都做教育，我的认知是不断叠加的。这帮大学生不太会贸然做自己过去没干过的事，都是想着怎么干得更好。他们有新一代的思维方式，在自己认知圈里不断迭代，勇于创造机会。

还有一点是勇敢闯荡的精神，不太会因为别人的否定而否定自己，有一种「I don't care what you think about me」的态度，非常自信。背后就是「高速实验」的文化，我知道我产品还没 ready，但我不管，快速上线、快速迭代、快速反馈。

Founder Park：这个风潮大概是从什么时候开始的？

Kai：我觉得是一种共识性的成功。当大家看到像 GPTZero 这样的项目，从宿舍里成长起来，不断迭代，然后获得资本助力和用户认可，这种快速试错、快速爆发的成功案例多了，就形成了共识。

一句话，「Better done than perfect」，完成比完美更重要。而且大家也不太担心竞争，硅谷很多 founder 都愿意把自己的产品理念讲出来，不怕你抄，我只要快速迭代就好。我觉得这一波年轻人还有很好的 story telling 的能力，这种讲故事不是假大空，而是在务实求真的基础上，加上自己对未来的展望。

Founder Park：先把自己营销出去。

Kai：对。我觉得底层的观念在于冒险精神和极度自信。在这种驱动下，他们就不断勇敢试错，不怕讲错话。大胆地讲自己的产品理念，大胆去执行，错了大不了再改。这种不怕试错的文化，促成了这一波大学生创业的热潮和成功。

美国那边的 VC 也都会看大学生的项目，YC 每期都会固定投一些大学生的项目。

08 融资是 VideoTutor 现在最不需要担心的事情

Founder Park：如果回到刚做 VideoTutor 的时候，你会给自己提什么建议？有什么可以做得更好的地方？

Kai：我觉得应该是节奏更快一点。还有就是团队组成。VideoTutor 的团队是经过多轮磨合的。如果早知道，我会更早地根据产品需要的技能画像，去更好地组建团队。我觉得创业回归到最后，组织能力非常关键。我会花更多时间在组织能力上：选人、识人、用好人。

现在的团队适合从 0 到 1 的成长，但要把 VideoTutor 做得更大，还是需要更有工作经验的人加入进来，把他们优秀的经验和能力带到团队，帮助整个团队共同成长。

Founder Park：未来半年内，你觉得 VideoTutor 可能会遇到什么样的产品或技术难题？

Kai：我觉得一个是渲染，要降到真正的零延迟，还需要工程上的突破。第二点是增长方面，我觉得是产品的 taste，这背后包含很多东西，比如 UI、交互设计是否丝滑完美，功能交互是否没有 bug，视觉布局是否漂亮等等。这些对我们来说都是考验。

James：我觉得一开始我们对 VideoTutor 的定位是针对所有学科的可视化教学辅导，但后来我们做得非常垂直，只针对数学领域，因为那是我们最擅长的。我们的数学渲染引擎是最专业的。接下来重点要突破的，可能就是横向扩展。比如，如何把可视化的优势带到文科类场景？比如解释「锄禾日当午，汗滴禾下土」。这是我们接下来在技术上要考虑的点。

Founder Park：会因为创始人的背景在后续扩张上遇到困扰吗？

Kai：不太会。其实有很多大的 VC 都找过我们，像 a16z 这些，不会在太早期出手，而是在团队已经有成功迹象时再助力，这样他们知道投资不会失败。我们和很多大 VC 都保持着很好的关系。

融资是 VideoTutor 最不需要担心的事情，最需要担心的还是围绕着用户生态和产品。

Twitter：https://twitter.com/BitpushNewsCN

比推 TG 交流群：https://t.me/BitPushCommunity

比推 TG 订阅： https://t.me/bitpush