Typography

活版印字

自定义构建-mysql

Posted at # blog

自定义构建mysql 在构建过程中,Docker 会将指定的上下文路径下的所有文件发送到 Docker 守护进程,并根据 Dockerfile 进行镜像构建。因此,确保所有构建所需的文件都位于指定的上下文目录中 OverView 这段Dockerfile的用途是创建一个包含自定义MySQL配置和初始化数据的Docker镜像。在镜像构建完成后,可以通过运行这个镜像来启动一个MySQL服务器,并自动执行初始化脚本,从而初始化数据库。 FROM mysql:8.0 # 定义工作目录 ENV WORK_PATH /usr/local/work # 定义被容器自动执行的目录 ENV AUTO_RUN_DIR /docker-entrypoint-initdb.d # 定义要执行的 shell 文件 ENV RUN_SHELL run.sh COPY ./mysql.cnf /etc/mysql/

部署

Posted at # blog

部署 docker 使用 apt 更新并安装依赖包 sudo apt-get update sudo apt-get install \ ca-certificates \ curl \ gnupg \ lsb-release 添加 Docker 官方 GPG 密钥 sudo mkdir -p /etc/apt/keyrings curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg 设置仓库 echo \ "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.gpg] https://

docker pull error

Posted at # blog # docker

docker pull error 报错 :Get "https://registry-1.docker.io/v2/": net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers) 解决方法 配置加速地址 vim /etc/docker/daemon.json { "registry-mirrors": ["https://docker.1panel.live"] } 重启docker systemctl restart docker 参考 docker pull 报错Get “https://registry-1.docker.io/v2/“: net/http: request canceled while waiting

评估LLM-GLUE

Posted at # LLM

评估LLM-CLUE OverView CLUEbenchmark/PyCLUE: Python toolkit for Chinese Language Understanding(CLUE) Evaluation benchmark (github.com) 下载数据,然后运行评估代码。这个过程通常相对完善了。https://github.com/CLUEbenchmark/PyCLUE 这个库就是封装好的脚本了。 # 加载保存好的模型路径(train.ipynb中最后打印出的model_file_dict中的'pb_model_file'地址) pb_model_file = '' # 测试数据路径(应包含test.txt文件) data_dir = '/workspace/projects/PyCLUE_Corpus/sentence_pair/afqmc' def submit_

评估LLM

Posted at # LLM

评估LLM 基础标准 Open LLM Leaderboard 是目前最流行的LLM评测榜单。它由Hugging Face 发布,评估LLM这几个基准数据集:小学科学、常识推理、多任务准确性、语言理解 CLUE 是中文LLM的通用评测榜单。它由北京大学发布,评估LLM这几个基准性数据集上的性能:中文回答、中文文档摘要、中文机器翻译、实体识别、词性标注、语义依存分析、阅读理解、推理 SuperGLUE: super General Language Understanding Evaluation 是一个多任务的自然语言理解NLU+的基准性测试,它结合了多个现有的NLU任务,如问答,文本蕴含,自然语言,以提供一个全面的评估 GLUE:是SuperGLUE的前身,它包含了多个NLP任务,如问答,文本蕴含,情感分析等GLUE是评估语言模型在多种语言理解任务上表现的重要基准 BIG-Bench: