-
问题现象: DSS全家桶启动后,在ECM服务日志看起来正常的情况下找不到ECM实例。具体表现为,通过web端->管理台->ECM管理进入查看,实例会在ECM服务启动后出现一小段时间然后消失,engineconnmanager、entrance、gateway、ps-publicservice等日志均未见报错,在ECM实例消失后linkismanager会提示engineconnmanager不存在,同期,eureka的web界面显示服务都正常。 版本:DSS1.0.1(即,官方release的DSS-Linkis全家桶20220223) 日志: engineconnmanager日志: linkismanager日志 尝试过的事宜: 1、关闭资源检查,在linkis/conf/linkis-cg-linkismanager.properties中配置wds.linkis.manager.rm.request.enable=false,单独重启linkismanager服务,用dss封装好的脚本14个服务全都重启,均无作用,现象和原始现象一致。 2、自己没太多理由的瞎尝试 - 换shell操作的用户,因为一开始是以root用户登录shell但配置文件deployUser以hadoop用户开启的服务,后面在shell上切换至hadoop用户,把hadoop服务和dss14个服务重新以hadoop用户执行install和start,无作用,现象和原始现象一致。 3、群友提示可能是服务通信问题,按照群友指导,修改服务器hostname,修改/etc/hosts解析在第一行添加映射,实测域名可解析后,删除原有安装文件和dss用到的数据库,修改外层全家桶的配置文件config.sh,将里面除了数据库以外所有需要IP的地方(包括yarn和以INSTALL_IP为后缀的变量全都取消注释赋值为我自己定义的hostname),重新进行install和start,无作用,现象和原始现象一致。 不知道有没有用的补充信息: 1、重启以后数据表里的em和linkis_resources表: |
Beta Was this translation helpful? Give feedback.
Replies: 1 comment
-
啊找到问题了,是我/etc/hosts配置里面多了127.0.0.1对我要用的这个hostname的解析,所以根本上应该还是没配好域名,导致内部通信可能出现了某种奇奇怪怪的问题我猜? |
Beta Was this translation helpful? Give feedback.
啊找到问题了,是我/etc/hosts配置里面多了127.0.0.1对我要用的这个hostname的解析,所以根本上应该还是没配好域名,导致内部通信可能出现了某种奇奇怪怪的问题我猜?