0、ECS主机运维
1)EWS是一款免费的容器服务软件。与ECS主机是两个概念,不存在"EWS主机"一说。
2)EWS是通过ews agent的方式工作在ECS上(添加资源池时安装agent),主机上ps -elf | grep acsa可以看到agent进程。
2.1)代码包下载、容器部署启动的相关工作均由agent执行
2.2)安装agent后,agent只会涉及Docker运行目录以及容器数据存储根目录。ECS上其他问题与EWS无关,请自行运维!
PS: ews agent的日志在/acs/system/agent/log/acsagent.log,如遇相关部署问题,如exit status 9,可以在日志中排查
1、运行一段时间后docker目录占用磁盘过高?
原因:docker文件系统占用(容器不断运行过程中产生的占用,垃圾回收不到位),一般是因为docker版本较低
解决方案一:清理docker文件,重新创建容器
1)删除ECS主机上docker文件系统数据
systemctl stop docker
rm -rf /var/lib/docker/
systemctl restart docker
2)EWS页面中,删除原来的容器,重新添加到主机上
解决方案二:升级docker(重新注册agent),重新创建容器
1)主机上卸载老的docker
2)在EWS页面重新添加云服务器,获得类似下面的指令
curl https://as-xx.acs.aliyun.com/agent/xxx| sudo bash
此步骤会自动安装目前较新的docker版本18.09.3-ce
3)EWS页面中,删除原来的容器,重新添加到主机上
注,这两种方法都会销毁容器,如果容器数量少,推荐方法一,可以定期清理重建
参考:https://blog.csdn.net/qq_36850813/article/details/91043125
2、删除了docker容器下的文件(如日志文件),为什么磁盘空间没有释放?du和df查看磁盘空间结果不一样?
文件被运行着的进程占用,此时删除,并不会实际的释放空间。可以通过停止进程(如重启下容器)或重启主机解决该问题。
du和df两个指令有区别,请自行搜索引擎。
3、 主机到期了,服务访问异常,怎么停止该主机上的容器实例?
EWS页面-资源池,找到主机,点击断开,会弹出如下弹出框,注意勾选上"停止并删除运行中的服务"
4、connetion not found
1)确认下ECS主机是否过期。如果过期,参考问题3;如果没有过期查看步骤2)
2)ps -elf | grep acsa,查看acsagent进程是否存在。如果存在, kill -9 <进程号>,两分钟后尝试重新部署
3)重启ECS主机后再尝试重新部署
5、添加资源池时,查询实例信息失败
1)EWS只支持聚石塔杭州、聚石塔上海、聚石塔张家口这三个地域的主机
2)首先检查主机实例是否从聚石塔购买;另外检查主机的地域
3)检查购买机器的账号与登录EWS获取安装指令所用的账号是否一致