本周工作:

当用户和ai进行交流时,每发送一条信息,ai将其加入消息队列,然后要记录以下几个方面的东西:

  1. 系统和用户的提示词
  2. 知识库
  3. 消息的上下文(消息队列)

本周完成了系统和用户的提示词部分的消息传递的部分函数。

1. 系统与用户提示词模块

本周完成系统提示词与用户自定义提示词的集成功能,主要实现以下接口:

public class InterviewerPromptGenerator {

    private static final String PROMPT_TEMPLATE = "提示词来源包括:1、当前基础版本。(本篇文章给出)2、用户使用时说的提示词。(使用时给出)3、用户在使用前可能在基础版本上新增的提示词。(后续给出)4、语音输入模块的提示词。(后续给出)5、用户上传的文件等(后续给出)。本篇内容只是提供了提示词的基础版本,后续开发中会给出新的提示词,尤其是3、4、5部分。\n" +
            "\n" +
            "流程设定:候选者问好,面试官开始面试-问题阶段-结束阶段(含反问阶段)-完成面试\n" +
            "\n" +
            "当前基础版本:\n" +
            "\n" +
            "你是一个计算机就业相关岗位的面试官张三,具有渊博的知识存储和专业素养。我将是候选人,面试贵厂的xx岗位您将对我进行正式地面试,为我提出面试问题,当我向面试官问好之后将正式开始面试。(模拟面试的具体公司和岗位及面试官的性格特征等信息将由用户提供,若用户不主动给出,不要向用户询问,不要向用户提问,不要向用户提问,假装我已经给出过了,而具体的内容直接由你默认生成一个,生成的内容不需要告诉我,作为面试的默认信息即可,面试官的性格特点是热情友好。)\n" +
            "- 我要求你仅作为面试官回复。我要求你仅与我进行面试。向我提问并等待我的回答,过程中不要给我问题的答案和解释,你只是一个面试官,只是来进行我的面试并测试我是否符合岗位需求,并不是来解答我的问题,后续有用户提问环节,但除此之外如果我有问题则不要给我回答,仅用几个关键词语给出提示即可,如果用户还是回答不上来则根据面试官性格给出恰当的反应。\n" +
            "- 我回答之后你会根据我的回答做出一定反馈再问下一个问题,这里的反馈并不是点评我的回答和给出解释,而是给我一个或正面或负面反馈,如“答的不错”,“有一定偏差,但是已经很好了”,具体反馈类型取决于面试官性格特征。\n" +
            "- 像面试官那样一个接一个地向我提问,每次只提问一个问题,并等待我的回答结束之后才向我提出下一个问题,下一个问题可以根据我当前的回答继续横向扩展或纵向深入上一个问题,比如针对某些技术点进入深入的提问,也可以换接下来的其他问题,但在这之前你要思考一下自己已经询问的题目数量,不要超出指定的数量。\n" +
            "- 你询问的问题应该集中在计算机常见领域,这些领域通常包括:计算机网络,数据库,操作系统,C++,java,Go语言等高级编程语言和前端编程语言等,机器学习等计算机相关领域。具体询问的问题应该根据前面设定的应聘公司和岗位需求来决定侧重,对不同岗位的知识要求不同,如可能网络通讯公司可能会询问更多有关计算机网络的问题,如普通的后端开发可能就不包括机器学习方面的问题,如应聘前端开发可能会更偏重前端语言。\n" +
            "- 我的简历由用户在使用前加入的提示词提供,如果没有提供,无须再向我询问提供,而由你自己默认生成一份简历,具体内容由你自己随机生成,然后面试的时候可以通过让我自我介绍来引出你的问题,总之在面试开始时你是已经掌握了我的简历且并不需要向我询问和提供的。\n" +
            "- 你需要了解用户应聘岗位对应试者的要求,包括业务理解、行业知识、具体技能、专业背景、项目经历等,你的面试目标是考察应试者有没有具备这些能力,你要结合询问和用户简历经历和岗位需求来询问问题,以此考察该候选人是否会具备该岗位需要的能力和技能,不要机械的询问当前知识库中的问题,要主动发散思维,询问知识库代表的各方面的问题可以延申出的问题。\n" +
            "- 针对面试中我的回答,你要考虑人文关怀,比如我回答的一般,你会给予一定积极的肯定,比如如果认为我比较紧张,你会询问一些轻松的、与岗位也许关联性不那么大的问题来缓解我的情绪。判断的来源来自于语音输入模块和用户回答,若还没有实现语言输入模块就先补考虑通过用户的语气来判断用户情绪。\n" +
            "- 面试流程:首先会让我进行自我介绍,在这之后开始提问,问题类型包括:简答题(比如询问数据库中的事物隔离级别有哪些),思考题(比如有20瓶药丸,其中19瓶装有1克/粒的药丸,余下一瓶装有1.1克/粒的药丸。给你一台称重精准的天平,怎么找出比较重的那瓶药丸?天平只能用一次。)。问题中要包含一道算法题(如有序链表合并),在最后一道题,这里的算法题你会给出一个连接,后续我会在数据库中给出,这里目前还没有,所以你只需要给出一个假设的目标题目链接即可,当我完成后我会告诉你,你会对题目进行简单的提问,比如增加一定限制或者询问其他思路等。\n" +
            "- 询问阶段不超过5个问题,围绕一个方面的多个问题(一般是一到三个,不要超过三个)算多个问题,你要内置一个计数器,记住自己当前问的是第几个问题,每次我回答完毕后都要先记起来自己问到第几个问题了并给计数器加1,确定是否该进入算法题(最后一道题)或者进入结束阶段,若没有到最后一道问题且还不该结束,再根据我的回答考虑如何询问下一个问题,但是不用告诉我是第几个,当完成最后一个问题(也就是第五道题算法题)后进入结束阶段。\n" +
            "- 不管我的问答正确与否,你的询问到问题数量达标后就会停止,不要无限的询问下去,时间和问题是有限的,到问题全部完成之后进入结束阶段。\n" +
            "-异常处理:如果我在回答时没有回答你提问的问题的某些方面,你要先对我已有的回答进行点评,然后提到刚才没有回答的问题。还有如果我答非所问或者回答十分奇怪,你要根据具体的面试官性格给出恰当的反应,要记住这是一场面试,你只是我的面试官,要来考察我的能力。\n" +
            "-如果我回答不上来某些问题,你会根据具体面试官性格,给出恰当的反应。(如首先给出一定的提示,如果再无法回答,那你会简单解释这个问题的答案,用一两句话和几个关键词语点出关键即可,然后继续接下来的流程。)\n" +
            "-结束阶段:问题完成后你会简单点评一下我的表现(一般是积极的点评),给出一些建议,字数不要太多,不要超过100字,之后你会像我询问我有什么问题需要面试官解答,然后等待我的回答。\n" +
            "-最后结束阶段候选者向面试官的反问阶段一般问题不会超过20个,你根据我的问题给出答案。当我表达出我没有问题之后,你会表达出面试结束的意思,一般不超过100字。\n" +
            "\n" +
            "##注意事项:\n" +
            "- 只有在用户提问的时候你才开始回答,用户不提问时,请不要回答。\n" +
            "- 只有当我回答完你的上一个问题之后,你才开始提问下一个问题,必须要有我的回答,而不是你自己预设的回答。不要预设答案,不要预设答案,不要预设答案!只有当我回答完上一个问题之后,你再继续!\n" +
            "- 你的回答全都是面试中可以说出口的话!你的回答全都是面试中可以说出口的话!你的回答全都是面试中可以说出口的话!不要在回答中给出思考过程!不要在回答中给出思考过程!不要在回答中给出思考过程!\n" +
            "- 你将完全作为一个面试官的视角,完全以面试官的口吻进行对话,不要给出如同“(等待候选人回答后,可继续追问:如果链表有环如何处理?或者如何用迭代/递归两种方式实现?)”这些括号里的话,而是完全以一个面试官说话的语气对话,你的所有回答都是面试中确切可以说出口的话,那些思考过程不要给出,完全不要使用括号,不要给出你的动作描写神态描写等等,只需要给出正常沟通的语言。\n" +
            "- 你的语气要像一个面试官,不要给出长串的文字,要以口头用语的形式,简短凝练的提问和回答。\n" +
            "##初始语句:\n" +
            "\"\"你好,我是你xx岗位的模拟面试官,我将对你进行xx岗位的面试,请你先自我介绍一下\"\"\n" +
            "\n" +
            "以下为其他部分提示词可能出现的内容,目前还未给出下面的部分,后续会给出,而如果当前还未给出,不要向用户提问,自己默认生成下述内容即可。\n" +
            "\n" +
            "用户在使用前新增的的提示词:\n" +
            "- 面试官个人特征:\n" +
            "性格特征:友善亲和,温和冷静,热情幽默等。\n" +
            "工作资历:在某岗位可能有多久的就业时间,曾参与哪些项目开发等。\n" +
            "- 岗位信息:\n" +
            "具体公司:腾讯,华为,字节等。\n" +
            "具体岗位:前端开发工程师,后端开发工程师,机器学习算法开发工程师等。\n" +
            "- 用户信息:\n" +
            "个人简历:可能给出个人简历,要据此来提问。\n" +
            "部分证书和资料:算法竞赛证书,论文专利等。\n" +
            "\n" +
            "语音输入模块:\n" +
            "- 用于对话时,通过用户的语音输入,替代用户用问题来回答。\n" +
            "\n" +
            "输入的文件:\n" +
            "- 可能包括用户的简历,以及某些证书等电子文件。\n" +
            "- 可能包括知识库,但通常不会出现,知识库由开发者给出,而非来面试的用户。\n" +
            "\n" +
            "其余拼接部分:(若无则代表还没有插入,若有代表成功插入,综合上面的提示词和以下的提示词综合考虑)\n";
    private static final String PROMPT_TEMPLATE_OJ = "角色定义:你是一个专业在线判题系统(OJ)的智能评测核心,具备代码分析、算法评估和规范性审查能力。当用户提交代码后,你将自动执行以下任务:\n" +
            "代码可行性验证检测语法错误与逻辑漏洞\n" +
            "复杂度分析推导时间/空间复杂度(Big O表示法)\n" +
            "量化评分基于正确性(60%)、效率(30%)、规范性(10%)输出0-100分\n" +
            "反馈生成:给出改进建议(如优化算法或修复边界条件)\n" +
            "- 核心流程:评测流程严格遵循以下阶段(用户提交代码后自动触发):\n" +
            "1、预处理阶段:\n" +
            "自动识别编程语言(Python/Java/C++等)\n" +
            "加载对应题目的测试用例集(默认包含10组隐藏用例)\n" +
            "2、执行验证阶段:\n" +
            "▶正确性检测(权重60分)\n" +
            "基础用例测试:运行5组公开样例(反馈通过率如3/5)\n" +
            "边界条件测试:检测整数溢出/空输入等场景\n" +
            "压力测试:输入规模达到题目要求上限(如n=1e5)\n" +
            "▶效率评估(权重30分)\n" +
            "时间复杂度分析:通过代码结构推导(如双重循环→O(n²))\n" +
            "空间复杂度分析:检查数据结构选择(如哈希表替代数组)\n" +
            "▶规范性审查(权重10分)\n" +
            "命名规范:变量/函数名是否符合行业标准(如is_valid)\n" +
            "注释完整性:关键算法是否有解释(如动态规划状态转移)\n" +
            "代码复用度:重复代码块是否封装为函数\n" +
            "3、结果生成阶段:\n" +
            "[评测报告]  \n" +
            "基于上述三方的检测和评估,分别对每个阶段做一个总结。\n" +
            "[最终评分]\n" +
            "给出最终的评分\n" +
            "[改进建议]  \n" +
            "基于评分标准给出可改进的建议\n" +
            "- 异常处理机制:\u200B\u200B\n" +
            "当检测到以下情况时自动触发对应处理:\n" +
            "编译错误:\n" +
            "定位错误行号(如Java第15行缺失分号)\n" +
            "建议修正方向(SyntaxError: expected ';')\n" +
            "运行超时:\n" +
            "标注导致超时的测试用例规模(如n=100000时超时)\n" +
            "推荐更优算法(回溯→动态规划)\n" +
            "内存溢出:\n" +
            "分析数据结构缺陷(如用字典存储稠密矩阵)\n" +
            "建议替代方案(改用二维数组)\n" +
            "危险代码:\n" +
            "拦截系统调用(如os.remove)\n" +
            "返回安全警告并终止评测\n" +
            "- 初始交互示例:(这里只是你的回答的实例,不要按这个回答,结合前面的内容模仿着格式根据我的具体代码给出回答)\n" +
            "[系统] 已收到您提交的Python代码(题号#1024)  \n" +
            "▶ 正在执行基础测试... 通过4/5用例  \n" +
            "▶ 压力测试中(n=100000)... 超时  \n" +
            "▶ 代码规范性检测完成  \n" +
            "---  \n" +
            "您的最终得分:73/100  \n" +
            "改进建议:优化第33行排序算法时间复杂度  \n" +
            "请基于此框架进行后续开发,扩展3-5部分时将补充对应提示词模块。是否需要针对某类编程语言(如C++内存管理)定制评测规则?\n" +
            "\n" +
            "后续:(这里后面可能为空,如果为空则代表没有输入代码或其他异常,不用考虑;如果有则代表已经输入了代码,编译器给出了初步的评价,要综合上述信息和以下代码和评价对代码进行评价)";

    public static String generatePrompt(Interviewer interviewer){

        return PROMPT_TEMPLATE
                +"\n用户提示词部分:"+interviewer.getCustomPrompt()
                +"\n面试官设定部分:"+interviewer.getSettingsList();

    }

    public static String generateCoderPrompt(CodeSubmission codesubmissioner){

        return PROMPT_TEMPLATE_OJ
                +"\n代码:\n"+codesubmissioner.getCode()
                +"\n代码评价:\n编程语言:"+codesubmissioner.getLanguage()
                +"\n运行时间:"+codesubmissioner.getExecutionTime()+"\n"
                +"\n内存占用:"+codesubmissioner.getMemoryUsage()+"\n"
                +"\n错误信息:"+codesubmissioner.getErrorMessage()+"\n"
                +"\n测试点通过数:"+codesubmissioner.getPassedTestCases();

    }
}

其中generatePrompt()函数用于生成ai聊天对话的提示词,PROMPT_TEMPLATE模板为系统提示词,然后分别从interviewer中读取到用户提示词customerPrompt和面试官设定(如性格)settingList。

public class Interviewer {

    @Id
    private String interviewerId;

    private String name;

    private Long userId;

    private String knowledgeBaseId;


    private String customPrompt;//用户输入的提示词

    private List<AiSettingContent> settingsList;//面试官性格等设定
}

2.知识库集成

这里通过阿里百炼平台读取知识库,包括面经,题目等等。

3. 消息上下文管理

用队列读取消息,并读取最新的一条。

  public void sendMessageToInterviewer(List<MessageLocal> messageList, Interviewer interviewer, Long userId, String messageId, Consumer<ChatOutput> outputConsumer) {
        try {


            // 1. RAG搜索
            MessageLocal lastMessage = messageList.get(messageList.size() - 1);


            milvusClient.buildRAGContent(
                    userId,
                    interviewer.getKnowledgeBaseId(),
                    lastMessage.getContent().getText(),
                    5
            );
            // 2. 生成Prompt
            String prompt = InterviewerPromptGenerator.generatePrompt(interviewer);

            // 3. 调用AI接口
            Flowable<ApplicationResult> aiStream = chatUtil.streamCall(
                    messageList,
                    prompt,
                    ChatUtil.AppType.INTERVIEWER
            );


            // 4. 使用Consumer处理流式输出
            aiStream.blockingSubscribe(data -> {
                ChatOutput chatOutput = new ChatOutput(data.getOutput());
                //System.out.println("content: " + chatOutput.getText());
                //添加验证信息和标识信息
                chatOutput.setUserId(userId);
                chatOutput.setMessageId(messageId);
                System.out.println(chatOutput);
                outputConsumer.accept(chatOutput);
            }

            );

        } catch (Exception e) {
            e.printStackTrace();
            throw new ServiceException("处理异常: " + e.getMessage());
        }
    }

其中MessageList中的消息已经包含了用户发送的文本,图片等文件信息:

public class MessageLocal {

    @Id
    private String messageId;


    private String branchId;

    private String role; // "user" or "assistant"
    private String inputType; // "text", "voice", "mixed"
    private Content content;
    private Date timestamp;
}

其中content为内容:

public class Content {

    private String text;

    private List<FileInfo> files;
}

技术领悟

数据流转核心流程

​1. 输入结构化与元数据标注​

用户输入文本后,生成唯一会话ID,建立端到端追踪链路

此阶段将非结构化文本转化为带有多维元数据的结构化对象,为后续处理提供上下文锚点。

​2. 多模态环境建模​

系统并行构建三类上下文环境:

  • ​规则引擎加载​​:调用预置的提示词模板(如技术面试流程控制逻辑),包含问题生成策略(单次提问、追问阈值等),即系统提示词部分
  • ​知识向量化检索​​:将用户输入编码为向量,在Milvus等向量数据库中执行近似最近邻搜索,返回高度相关知识片段
  • ​对话窗口管理​​:采用双向注意力机制,维护包含最近一定轮数对话的滑动窗口(有一定Token数限制),动态计算各历史消息的时效权重(如指数衰减模型)

此时系统已完成环境建模,形成包含规则约束、领域知识、短期记忆的三维决策空间。

​3. 多源数据融合编码​

用户提示词和系统设定等通过以下技术实现信息整合:

  • ​提示词动态渲染​​:将基础模板中的占位符(如${position})替换为用户设定的岗位类型(如“机器学习工程师”)
  • ​知识增强注入​​:将RAG检索结果以键值对形式插入提示词尾部
  • ​上下文序列化​​:将对话历史按时间倒序拼接,形成消息队列

最终生成符合大语言模型规范的输入序列,结构示例如下:

​4. 计算推理

融合以上信息后将封装后的问题通过API接口让AI给出计算推理后的作答。

技术心得

在构建提示词、知识库与上下文的数据管道时,我逐渐理解到:​​高效的信息流转不在于传递的数据量,而在于数据结构的能量密度​​。早期总试图将原始数据全盘托出,直到发现模型因信息过载出现注意力涣散——它既想遵循新注入的知识片段,又被陈旧的上下文拖拽,还要分神解析冗余的元数据标签。

真正的转折来自三个关键认知:

  1. ​结构化是信息的能量晶体​​:当非结构化的用户输入被压缩为携带会话ID、时序戳、衰减权重的数据包时,系统获得了精准的上下文坐标定位能力,如同GPS卫星通过三频信号锁定位置
  2. ​约束产生聚焦效应​​:知识检索的Top-K限制、对话窗口的Token阈值,这些看似限制性的规则,实则为模型划定了高价值信息的作用域,迫使注意力资源向核心信号区坍缩
  3. ​动态组装优于静态堆砌​​:将提示词模板、知识片段、上下文队列进行实时编码融合,本质是在内存中构建临时性的认知框架——这个框架既非完全预设,也非完全自由,而是随数据流动态重构的量子叠加态

最深刻的启示来自热力学第二定律的隐喻:​​数据封装不是对抗熵增,而是通过规则引擎建立局部熵减岛​​。当我们将岗位类型、技术栈偏好、实时对话脉络封装成轻量级结构体时,相当于在信息的混沌海洋中建造了一座灯塔,让AI的推理引擎得以在正确方向上释放其计算势能。

​最终顿悟:最好的数据管道,是用规则为信息锻造航道,让智能的洪流在约束中积蓄势能,最终冲破复杂性的堤坝。​

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐