快速开始
本指南将帮助您快速部署和配置AIOPS智能运维平台,让您能够尽快开始使用系统的各项功能。
1. 系统准备
1.1 硬件要求
| 组件 | 最低配置 | 推荐配置 | 说明 |
|---|---|---|---|
| CPU | 4核 | 8核 | 系统处理能力 |
| 内存 | 8GB | 16GB | 系统运行内存 |
| 存储 | 200GB HDD | 500GB SSD | 数据存储和日志 |
| 网络 | 千兆网卡 | 万兆网卡 | 确保数据传输性能 |
1.2 软件要求
| 软件 | 版本 | 用途 |
|---|---|---|
| 操作系统 | CentOS 7.6+/Ubuntu 18.04+ | 系统运行环境 |
| Docker | 20.10+ | 容器化部署 |
| Docker Compose | 2.0+ | 容器编排 |
| MySQL | 5.7+/8.0+ | 关系型数据库 |
| Redis | 6.0+ | 缓存系统 |
| Kafka | 2.7+ | 消息队列(可选) |
2. 部署方式
AIOPS平台支持多种部署方式,您可以根据实际情况选择合适的方式。
2.1 Docker Compose部署(推荐)
Docker Compose部署是最简单快捷的方式,适合测试环境或小规模生产环境。
2.1.1 准备工作
# 安装Docker和Docker Compose
curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun
systemctl enable docker && systemctl start docker
# 安装Docker Compose
curl -L "https://github.com/docker/compose/releases/latest/download/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
chmod +x /usr/local/bin/docker-compose
2.1.2 获取部署文件
# 克隆部署仓库
git clone https://github.com/your-org/aiops-deploy.git
cd aiops-deploy
2.1.3 修改配置
编辑.env文件,配置必要的环境变量:
# 数据库配置
DB_HOST=mysql
DB_PORT=3306
DB_USER=aiops
DB_PASSWORD=your_password
DB_NAME=aiops
# Redis配置
REDIS_HOST=redis
REDIS_PORT=6379
REDIS_PASSWORD=your_redis_password
# 系统配置
ADMIN_USERNAME=admin
ADMIN_PASSWORD=your_admin_password
# 服务配置
API_PORT=8080
UI_PORT=80
2.1.4 启动服务
# 启动所有服务
docker-compose up -d
# 查看服务状态
docker-compose ps
2.2 二进制部署
二进制部署适合对系统有特殊定制需求的场景。
2.2.1 准备工作
确保已安装所有必要的依赖:
# CentOS
yum install -y gcc gcc-c++ make cmake
# Ubuntu
apt-get update
apt-get install -y build-essential cmake
2.2.2 下载二进制包
从官方网站下载最新的二进制包:
wget https://github.com/your-org/aiops/releases/download/v1.0.0/aiops-v1.0.0-linux-amd64.tar.gz
tar -zxvf aiops-v1.0.0-linux-amd64.tar.gz
cd aiops-v1.0.0-linux-amd64
2.2.3 配置文件
编辑config/config.yaml文件,配置系统参数:
# 数据库配置
database:
host: localhost
port: 3306
user: aiops
password: your_password
name: aiops
# Redis配置
redis:
host: localhost
port: 6379
password: your_redis_password
# 服务配置
server:
api:
port: 8080
ui:
port: 80
# 日志配置
log:
level: info
path: /var/log/aiops
2.2.4 启动服务
# 启动API服务
./bin/aiops-api -c config/config.yaml &
# 启动UI服务
./bin/aiops-ui -c config/config.yaml &
2.3 Kubernetes部署
Kubernetes部署适合大规模生产环境,提供更好的可扩展性和高可用性。
2.3.1 准备工作
确保已安装kubectl并配置好Kubernetes集群:
# 安装kubectl
curl -LO "https://dl.k8s.io/release/$(curl -L -s https://dl.k8s.io/release/stable.txt)/bin/linux/amd64/kubectl"
chmod +x kubectl
mv kubectl /usr/local/bin/
# 配置kubectl
mkdir -p ~/.kube
cp /path/to/admin.conf ~/.kube/config
2.3.2 创建命名空间
kubectl create namespace aiops
2.3.3 应用配置
# 创建Secret存储敏感信息
kubectl create secret generic aiops-secrets \
--from-literal=db-password=your_db_password \
--from-literal=redis-password=your_redis_password \
--from-literal=admin-password=your_admin_password \
-n aiops
# 应用部署配置
kubectl apply -f kubernetes/deployment.yaml -n aiops
kubectl apply -f kubernetes/service.yaml -n aiops
kubectl apply -f kubernetes/ingress.yaml -n aiops
3. 首次访问
3.1 访问系统
部署完成后,可以通过以下方式访问系统:
- Web界面:http://your-server-ip:80(Docker Compose部署)或 http://your-domain(Kubernetes部署)
- API接口:http://your-server-ip:8080/api/v1
3.2 登录系统
使用默认管理员账号登录系统:
- 用户名:admin
- 密码:your_admin_password(在配置文件中设置的密码)
3.3 修改默认密码
首次登录后,请立即修改默认管理员密码:
- 点击右上角的用户头像
- 选择"个人设置"
- 在"账号安全"页面修改密码
4. 初始配置
4.1 配置数据源
登录系统后,首先需要配置数据源,以便系统能够采集监控数据:
- 进入"配置中心" > "数据源管理"
- 点击"新增数据源"
- 选择数据源类型(如MySQL、Redis、Prometheus等)
- 填写数据源连接信息
- 点击"测试连接"验证连接是否成功
- 点击"确定"保存配置
4.2 部署采集器
根据需要监控的资源类型,部署相应的采集器:
4.2.1 服务器采集器
# 下载并安装服务器采集器
wget https://github.com/your-org/aiops/releases/download/v1.0.0/aiops-agent-v1.0.0-linux-amd64.tar.gz
tar -zxvf aiops-agent-v1.0.0-linux-amd64.tar.gz
cd aiops-agent-v1.0.0-linux-amd64
# 配置采集器
vim config/agent.yaml
# 修改server.url为AIOPS平台的API地址
# 启动采集器
./bin/aiops-agent -c config/agent.yaml
4.2.2 容器采集器
对于Kubernetes集群,建议使用DaemonSet方式部署采集器:
# 配置采集器
kubectl apply -f kubernetes/agent-daemonset.yaml -n aiops
4.3 配置告警规则
配置告警规则,以便系统能够及时发现和通知异常情况:
- 进入"配置中心" > "告警规则管理"
- 点击"新增告警规则"
- 设置规则名称、监控对象、告警条件、告警级别等
- 配置告警通知方式(邮件、短信、企业微信等)
- 点击"确定"保存配置
5. 验证部署
部署完成后,可以通过以下方式验证系统是否正常运行:
5.1 检查服务状态
# Docker Compose部署
docker-compose ps
# Kubernetes部署
kubectl get pods -n aiops
5.2 检查监控数据
- 登录系统Web界面
- 进入"监控中心" > "仪表盘"
- 检查是否能够看到监控数据
5.3 测试告警功能
可以手动触发一个告警,测试告警功能是否正常:
- 配置一个简单的告警规则(如CPU使用率超过1%)
- 等待几分钟,检查是否收到告警通知
6. 常见问题排查
6.1 服务启动失败
- 检查配置文件是否正确
- 检查端口是否被占用
- 检查数据库连接是否正常
- 查看日志文件获取详细错误信息
6.2 无法采集数据
- 检查采集器是否正常运行
- 检查采集器配置是否正确
- 检查网络连接是否正常
- 检查被监控对象是否允许访问
6.3 界面访问异常
- 检查UI服务是否正常运行
- 检查网络连接和防火墙设置
- 清除浏览器缓存后重试
7. 下一步
8. 联系支持
如果在部署和使用过程中遇到任何问题,请联系技术支持:
- 邮箱:support@aiops.com
- 电话:400-123-4567
- 工单系统:https://support.aiops.com
