医院网站建设最新报价衡水做网站找谁
医院网站建设最新报价,衡水做网站找谁,购物网站首页模板下载,网站域名需icp备案吗深度学习#xff1a;项目四项目实例任务#xff1a;实现多语言#xff0c;多风格的电商评论摘要生成。最重要的tokenize_function(tokenizer, examples)部分#xff1a;将评论内容转换成模型能理解的指令格式#xff0c;并转变为token id.instruction tokenizer(generate…深度学习项目四项目实例任务实现多语言多风格的电商评论摘要生成。最重要的tokenize_function(tokenizer, examples)部分将评论内容转换成模型能理解的指令格式并转变为token id.instruction tokenizer( generate_review_title_prompt_tmp0(examples[review_body]), # 生成指令文本 add_special_tokensFalse # 不自动添加特殊token )tokenizer的作用将文本转换成模型能处理的数字token IDsgenerate_review_title_prompt_tmp0函数的作用这个函数来自utils.py会把原始评论包装成带格式的指令。也就是生成系统提示符能让系统更好的处理输入的数据这样处理后带有系统提示符格式的数据被转换成为token id。同样的方法对review_title部分进行处理评价指标BLEU以上是模型微调阶段用的是千问模型。接下来是模型推理验证阶段bleu)用训练好的模型可以是基础模型也可以是加了LoRA的模型对测试数据生成评论标题并计算BLEU分数评估生成质量。输入test.jsonl包含review_body和review_title ↓ 随机抽取sample_size条数据 ↓ 对每条数据 review_body → 包装成指令 → 模型生成标题 → 得到summary ↓ 保存结果到output.jsonl新增summary字段 ↓ 计算BLEU分数评估生成质量 ↓ 输出BLEU-1和BLEU-2分数面经1. encoder-only和decoder-only的模型在任务上有啥区别结构上有啥区别是怎么完成区分的encoder-only(bert为代表专注于理解语义任务由于模型可以同时看到上下文的双向信息它在文本分类、情感分析及语义抽取等需要深层文本理解的场景中表现优异。Decoder-only以 GPT、Qwen 为代表专注于内容生成任务。采用自回归方式基于已生成的上下文逐个预测下一个 Token适用于对话系统、文章创作、代码生成等生成式场景。结构上的核心区别注意力机制两者在 Transformer 块的层级结构上相似最本质的区别在于注意力机制的交互范围双向注意力用于理解应用在 Encoder-only 结构中。每一个 Token 在计算时都可以“看到”序列中前后所有的 Token 信息。因果掩码注意力用于预测应用在 Decoder-only 结构中。每一个 Token 只能看到其左侧已出现的 Token 信息无法看到右侧未来的信息。2.lora的rank值一般取多少都能作用在哪些fc上rank81632作用在QKV和FFN投影矩阵上。W1W▲W▲W是低秩的3.介绍一下在prompt阶段的增强的方法Prompt 阶段的常见增强方法CoT思维链通过示例引导模型输出“推理步骤”零样本插入“让我们一步步思考”引导推理Few-shot提供 3-5 个标准的“输入-输出”示例Self-Correction自洽性生成多个回答并进行投票C笔试1.统计文章内各个符号个数有一篇文章共有4行文章每行有60个字符。要求分别统计出其中英文大写字符、小写字母、数字、空格以及其他字符的个数。#include stdio.h #includestdlib.h #includestring.h int main() { char str[61] ; int daxie0, xiaoxie0, nope0, data0, other0; int j 0; for (int i 0; i 4; i) { gets(str); while (str[j] ! \0) { if (str[j] A str[j] Z) daxie; else if (str[j] a str[j] z) xiaoxie; else if (str[j] 0 str[j] 9) data; else if (str[j] ) nope; else other; j; } j 0; } printf_s(大写字母数目是%d, daxie); return 0; }2,译码字符串问题有一行电文已按下面规律译成密码A→Z,a→z,B→Y,b→y,C→X,c→x;即第1个字母变成第26个字母第i个字母变成第26–i1个字母。非字母符号不变。要求编程序将密码译回原文并输出密码和原文。#includestdlib.h #includestring.h char sitch(char stm) { if (stm Z stm A ) { stm Z - stm A; } if (stm z stm a) { stm z - stm a; } return stm; } int main() { char str[100]; gets(str); int i 0; char str_ch; printf_s(密码是\n); while (str[i] ! \0) { printf_s(%c, str[i]); i; } int j 0; printf_s(\n); printf_s(原文是:\n); while (str[j] ! \0) { if (str[j] Z str[j] A || str[j] z str[j] a) { str_ch sitch(str[j]); printf_s(%c, str_ch); } else printf_s(%c, str[j]); j; } return 0; }3. 循环排队代码实在不会写有n个人围成一圈顺序排号。从第一个人开始报数从1到3报数凡报到3的人退出圈子问最后留下来的是原来第几号的那位要求用指针知识实现。int main() { int n; printf_s(请输入人数n:); scanf_s(%d, n); int* person (int*)malloc(n * sizeof(int)); int* end person n; int count 0, remain n; int* p person; int visited [100]; for (int i 0; i n; i) { visited[i] 1; } for (int i 0; i n; i) { *(person i) i ; } while (remain ! 0) { if(visited[j]) } return 0; }4.写一个函数将一个字符串中的元音字母复制到另一个字符串然后输出。#include stdio.h #includestdlib.h #includestring.h int main() { char a[20], str2[20]; printf(请输入字符串); gets(a); int i 0,j0; while (a[i] ! \0) { if (a[i] a || a[i] e || a[i] i || a[i] o || a[i] u || a[i] A || a[i] E || a[i] I || a[i] O || a[i] U) { str2[j] a[i]; printf_s(%c, str2[j]); j; } i; } str2[j] \0; return 0; }算法动态规划从初始状态开始经过一系列状态转移到达目标状态求最优解方案数概率等。要求1.状态转移必须有方向且不可以成环2. 状态的个数要在可接受范围内。背包问题