编辑
2025-03-10
👨‍🎓 无限进步
00

在处理大模型的计费与向量生成的Token计数时,其逻辑存在显著差异,具体分为以下几个层面:


1. 计费Token与向量生成Token的本质差异

维度计费Token向量生成Token
定义API服务商根据输入输出内容计算的收费单位模型处理输入文本时实际消耗的计算单位
计算范围通常包含输入和输出的总Token数(如GPT系列)仅包含输入文本的Token数(如Embedding模型)
标准化程度由服务商定义(如OpenAI使用tiktoken库)依赖模型自身的分词器实现
业务影响直接影响API调用成本反映模型计算复杂度
编辑
2025-03-10
👨‍🎓 无限进步
00

commit的 Message的格式

shell
<type>(<scope>): <subject> <BLANK LINE> <body> <BLANK LINE> <footer>
编辑
2025-02-07
👨‍🎓 无限进步
00

以下是为您制定的21天科学减肥计划,结合饮食、运动与生活习惯调整,帮助健康减脂(目标减重3-5斤):

编辑
2025-02-05
👨‍🎓 无限进步
00

如何分析接口响应的问题?

1. 背景

公司项目中,某个业务接口会出现,100次的请求,有1-2次的请求速度会非常慢,领导有以下要求:

  1. 要能够监控后端接口,及时发现请求慢的接口是哪些?
  2. 找到请求慢的接口之后,需要对其接口进行详细分析,这个过程中要可以直观看出哪些函数调用花费的时间是多少?
编辑
2025-01-24
👨‍🎓 无限进步
00

参考:英文博客:interview gone wrong

python
if (cell[0][0] == cell[1][1] == cell[2][2]) { return Winner }