张家口北京网站建设大连 做 企业网站
张家口北京网站建设,大连 做 企业网站,网络营销心得体会800字,安徽住房建设厅官网GLM-OCR部署教程#xff1a;Nginx反向代理HTTPS配置#xff0c;对外提供安全OCR API
1. 项目概述与环境准备
GLM-OCR是一个强大的多模态OCR识别模型#xff0c;能够处理复杂文档理解、表格识别和公式识别等任务。在实际应用中#xff0c;我们通常需要将其部署为安全的API…GLM-OCR部署教程Nginx反向代理HTTPS配置对外提供安全OCR API1. 项目概述与环境准备GLM-OCR是一个强大的多模态OCR识别模型能够处理复杂文档理解、表格识别和公式识别等任务。在实际应用中我们通常需要将其部署为安全的API服务以便外部系统能够安全调用。1.1 基础环境要求在开始配置之前请确保你的服务器满足以下要求Ubuntu 18.04 或 CentOS 7 操作系统已安装并运行GLM-OCR服务默认端口7860服务器拥有公网IP地址已注册域名用于HTTPS证书至少2GB可用内存1.2 安装必要组件首先更新系统并安装Nginx# Ubuntu/Debian系统 sudo apt update sudo apt install nginx # CentOS/RHEL系统 sudo yum install epel-release sudo yum install nginx安装Certbot用于SSL证书申请# Ubuntu/Debian sudo apt install certbot python3-certbot-nginx # CentOS/RHEL sudo yum install certbot python3-certbot-nginx2. Nginx反向代理配置2.1 基础反向代理设置创建Nginx配置文件将外部请求转发到本地的GLM-OCR服务sudo nano /etc/nginx/sites-available/glm-ocr添加以下配置内容server { listen 80; server_name your-domain.com; # 替换为你的域名 # 反向代理到GLM-OCR服务 location / { proxy_pass http://localhost:7860; proxy_set_header Host $host; proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; proxy_set_header X-Forwarded-Proto $scheme; # 增加超时时间适应OCR处理耗时 proxy_connect_timeout 300s; proxy_send_timeout 300s; proxy_read_timeout 300s; } # 静态文件缓存配置 location /static/ { alias /root/GLM-OCR/static/; expires 1d; add_header Cache-Control public; } }启用配置文件并测试sudo ln -s /etc/nginx/sites-available/glm-ocr /etc/nginx/sites-enabled/ sudo nginx -t # 测试配置是否正确 sudo systemctl reload nginx # 重新加载配置2.2 配置验证验证反向代理是否正常工作# 检查Nginx状态 sudo systemctl status nginx # 测试端口访问 curl -I http://localhost curl -I http://your-domain.com # 替换为你的域名如果看到HTTP 200响应说明反向代理配置成功。3. HTTPS安全配置3.1 获取SSL证书使用Certbot自动获取并配置SSL证书sudo certbot --nginx -d your-domain.com # 替换为你的域名按照提示操作Certbot会自动完成证书申请和Nginx配置更新。3.2 强化安全配置更新Nginx配置增加安全相关的HTTP头server { listen 443 ssl http2; server_name your-domain.com; ssl_certificate /etc/letsencrypt/live/your-domain.com/fullchain.pem; ssl_certificate_key /etc/letsencrypt/live/your-domain.com/privkey.pem; # SSL安全配置 ssl_protocols TLSv1.2 TLSv1.3; ssl_ciphers ECDHE-ECDSA-AES128-GCM-SHA256:ECDHE-RSA-AES128-GCM-SHA256:ECDHE-ECDSA-AES256-GCM-SHA384:ECDHE-RSA-AES256-GCM-SHA384:ECDHE-ECDSA-CHACHA20-POLY1305:ECDHE-RSA-CHACHA20-POLY1305:DHE-RSA-AES128-GCM-SHA256:DHE-RSA-AES256-GCM-SHA384; ssl_prefer_server_ciphers off; # 安全头部 add_header Strict-Transport-Security max-age63072000; includeSubDomains; preload; add_header X-Frame-Options DENY; add_header X-Content-Type-Options nosniff; add_header X-XSS-Protection 1; modeblock; add_header Referrer-Policy strict-origin; location / { proxy_pass http://localhost:7860; # 保持之前的代理配置 } } # HTTP重定向到HTTPS server { listen 80; server_name your-domain.com; return 301 https://$server_name$request_uri; }3.3 证书自动续期设置定时任务自动续期SSL证书# 编辑crontab sudo crontab -e # 添加以下行每周一凌晨2点检查续期 0 2 * * 1 /usr/bin/certbot renew --quiet4. API访问与测试4.1 安全的API调用示例配置完成后可以通过HTTPS安全地调用GLM-OCR APIimport requests from gradio_client import Client # 使用HTTPS连接 client Client(https://your-domain.com) # 替换为你的域名 def secure_ocr_recognition(image_path, prompt_typeText Recognition:): 安全调用GLM-OCR API进行文字识别 Args: image_path: 图片路径 prompt_type: 识别类型Text Recognition:/Table Recognition:/Formula Recognition: Returns: 识别结果 try: result client.predict( image_pathimage_path, promptprompt_type, api_name/predict ) return result except Exception as e: print(fAPI调用失败: {str(e)}) return None # 使用示例 result secure_ocr_recognition(document.png, Text Recognition:) print(result)4.2 批量处理脚本创建安全的批量处理脚本import os import requests from requests.adapters import HTTPAdapter from urllib3.util.retry import Retry class SecureOCRClient: def __init__(self, base_url): self.base_url base_url self.session self._create_secure_session() def _create_secure_session(self): 创建安全的HTTP会话 session requests.Session() retry_strategy Retry( total3, backoff_factor0.5, status_forcelist[500, 502, 503, 504] ) adapter HTTPAdapter(max_retriesretry_strategy) session.mount(https://, adapter) return session def batch_process(self, image_folder, output_file): 批量处理文件夹中的图片 results [] for filename in os.listdir(image_folder): if filename.lower().endswith((.png, .jpg, .jpeg, .webp)): image_path os.path.join(image_folder, filename) result self.process_image(image_path) results.append({file: filename, result: result}) # 保存结果 with open(output_file, w, encodingutf-8) as f: for item in results: f.write(f{item[file]}: {item[result]}\n) return results def process_image(self, image_path): 处理单张图片 # 实现具体的API调用逻辑 pass5. 性能优化与监控5.1 Nginx性能调优调整Nginx配置以优化OCR服务的性能# 在/etc/nginx/nginx.conf的http块中添加 http { # 优化缓冲区大小 proxy_buffers 16 32k; proxy_buffer_size 64k; proxy_busy_buffers_size 128k; # 优化连接超时 keepalive_timeout 65; keepalive_requests 1000; # 启用Gzip压缩 gzip on; gzip_vary on; gzip_min_length 1024; gzip_types text/plain text/css application/json application/javascript text/xml application/xml image/svgxml; }5.2 服务监控配置设置基本的服务监控# 创建监控脚本 sudo nano /usr/local/bin/monitor_glm_ocr.sh添加以下内容#!/bin/bash # 检查GLM-OCR服务状态 check_service() { if curl -s http://localhost:7860 /dev/null; then echo GLM-OCR服务运行正常 return 0 else echo GLM-OCR服务异常 return 1 fi } # 检查Nginx状态 check_nginx() { if systemctl is-active --quiet nginx; then echo Nginx服务运行正常 return 0 else echo Nginx服务异常 return 1 fi } # 执行检查 check_service check_nginx设置定时监控# 每5分钟检查一次服务状态 */5 * * * * /usr/local/bin/monitor_glm_ocr.sh /var/log/glm-ocr-monitor.log6. 安全加固措施6.1 防火墙配置配置防火墙限制访问# 启用防火墙如果未启用 sudo ufw enable # 允许HTTP和HTTPS sudo ufw allow 80/tcp sudo ufw allow 443/tcp # 拒绝其他所有入站连接 sudo ufw default deny incoming # 查看防火墙状态 sudo ufw status6.2 访问限制配置在Nginx中添加访问限制# 在server块中添加限流配置 limit_req_zone $binary_remote_addr zoneocrlimit:10m rate10r/s; server { # ... 其他配置 location / { # 限流配置每秒10个请求 limit_req zoneocrlimit burst20 nodelay; # IP白名单可选 # allow 192.168.1.0/24; # deny all; proxy_pass http://localhost:7860; # ... 其他代理配置 } }7. 故障排查与维护7.1 常见问题解决端口冲突问题# 检查端口占用 sudo lsof -i :7860 sudo lsof -i :80 sudo lsof -i :443 # 停止占用进程 sudo kill -9 PID证书问题# 手动续期证书 sudo certbot renew --force-renewal # 检查证书状态 sudo certbot certificates服务日志查看# Nginx错误日志 sudo tail -f /var/log/nginx/error.log # GLM-OCR服务日志 tail -f /root/GLM-OCR/logs/glm_ocr_*.log # 系统日志 sudo journalctl -u nginx -f7.2 定期维护任务创建维护脚本#!/bin/bash # 定期清理日志文件 find /var/log/nginx -name *.log -mtime 7 -exec rm {} \; find /root/GLM-OCR/logs -name *.log -mtime 7 -exec rm {} \; # 重启服务每周一次 systemctl restart nginx8. 总结通过本教程我们成功将GLM-OCR服务配置为通过Nginx反向代理和HTTPS提供安全的API服务。这种部署方式不仅提高了服务的安全性还增强了可靠性和可扩展性。主要配置要点回顾反向代理配置使用Nginx将外部请求转发到本地GLM-OCR服务HTTPS加密通过Lets Encrypt获取免费SSL证书启用安全通信性能优化调整Nginx参数以适应OCR服务的特点安全加固配置防火墙、访问限制和安全头部监控维护设置服务监控和定期维护任务这种部署架构为GLM-OCR服务提供了生产环境级别的安全保障可以放心地对外提供OCR识别API服务。实际部署时记得根据你的具体需求调整配置参数。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。