文档中心 > 聚石塔

淘点点合作方入塔方案

更新时间:2015/09/18 访问次数:35502

 淘点点合作方入驻聚石塔流程

登塔商务阶段

该阶段主要由淘点点业务小二和电商云本地服务小二对接执行,主要目的是明确登塔的意愿,达成登塔承诺,签订相关合同。而针对不同模式不同复杂程度的产品登塔,需要进行不同的交流模式,详细的商务交流如下:

1基础交流

1) 主要由淘点点业务小二和电商云本地服务小二与淘点点合作方沟通联系,全面的传达聚石塔的价值;

2) 了解并简单收集淘点点合作方对于登塔的难处和问题;

3) 将收集到的问题内部组织相关涉及到的小二进行会议讨论,确定聚石塔可以给出的特殊方案,最终确立登塔意愿;

2会务商讨

【会务形式】

1) 电话会议

2) 面谈会议

【会务参与角色】

1)淘点点商家重要人员:公司运营负责人、技术负责人、或公司总经理等。

2) 淘点点业务小二、聚石塔小二重要人员:淘点点业务接口人、电商云团队本地小二接口人、IT咨询团队接口人、KA团队接口人;特殊情况附带人员DBA团队小二、安全保障团队小二、电商云团队技术支持小二、聚石塔产品团队小二等

【会务最终目标】

1) 商务上要解除用户的顾虑,给出最好的解决方案,敲定用户登塔意愿;

2) 技术上根据用户的实际情况(软件架构、技术能力、人员能力),结合聚石塔的登塔规则给出完整的登塔方案,包括分期登塔架构、分期登塔技术改造内容、时间计划、需要聚石塔提供的其他云产品(如OCS,OSS,SLB,中间件ODPSTISVPN等);

3) 业务上确定用户的功能拓展需求,增值业务数据需求,锁定重点扶植对象,后续能清晰的、高效的配合用户做业务拓展;

3 合同签订

1) 《增值API调用改造承诺书》:针对长征项目(增值API)推动登塔的ISV/商家,在商榷定出登塔架构和时间计划之后,如果无法在项目最后期限前完成,淘点点合作方需要签订该协议,承诺出具体的改造计划;

2) 《系统架构改造迁移承诺书》:其他情况推动登塔的淘点点合作方,如果系统架构不符合聚石塔的登塔规则,如:CS架构的系统,需要一段比较长的时间进行架构改造,在与聚石塔相关关小二商议落实之后,ISV/商家需要签订

聚石塔架构审核

商务阶段达成登塔协议之后,用户需要提供产品说书、产品架构等资料给本地服务小二,可参考模板【软件登塔方案-模板】,小二按照登塔规则和架构要求进行登塔架构审核。若审核不通过,要求按照聚石塔规则在签订改造承诺书的前提下进行架构改造。

资料模板下载:https://img.alicdn.com/top/i1/T1.9NPFeNfXXcAwpjX.rar

登塔审核基本规则参考//open.taobao.com/doc/detail.htm?id=101591

登塔实施阶段

1、前期准备

1) 淘点点合作方调研:提前与淘点点合作方沟通,确保商家切换系统的意愿.

2) 排计划:按现有淘点点合作方数量和订单量安排分批迁移的时间计划;并与淘点点合作方确认到位(特别是针对非saas化系统)

2、登塔过程

第一步:当前服务器资源确认

1) 如果当前服务器是部署在自己本地机房或是托管在IDC,直接按二三四步骤走下去;

2) 如果现在的硬件资源是原购买阿里云资源,可以先进行下面3步:

  • 聚石塔本地小二会协助用户找阿里云接口人退剩余时间的余款;
  • 如果用户曾经在阿里云享有优惠,阿里云接口人负责计算出用户剩余优惠时间,通知聚石塔,聚石塔接口人将给予用户同等优惠时间;
  • 用户在聚石塔portal重新购买云资源,聚石塔电商云咨询顾问团队会负责指导用户进行应用和数据迁移工作。用户也可直接按照二三四步骤自行进行;

第二步:硬件资源(VM/RDS)配置评估

1) 根据自己现有批量入塔的商家数据量和总订单量评估出需要一次性购买多少台VMRDS

2) 可以根据商家本地老系统的硬件资源使用情况估算,如应用服务器的cpu、内存、带宽、io读写的使用率,数据库的qpstpsfullscancpu等指标使用率;

3) 也可以参照机型选择模板;(该模板仅供初级参考

第三步:硬件购买

1) 批量购买:特别是saas模式的系统,多个用户资源共享,大批量用户批量迁入,淘点点商家需要横向扩充硬件资源,所以一个淘点点商家帐号需要批量购买多台VMRDS

2) 单台购买:淘点点商家也可以一台一台操作购买,比较适合非saas部署的系统,进云portal页面,根据不同商家的情况选择适合的VMRDS

http://cloud.tmall.com/hostSelection.htm?spm=0.0.0.0.RgGocR

参见购买指南://open.taobao.com/doc/detail.htm?id=982

第四步:硬件基本配置

1) VMRDS上用户名/密码设置;

2) 设置RDS可信IP地址:链接该RDSVM IP地址;

  

3) RDS/VM各个指标的警戒值设置;

5) 数据推送设置:如果系统需要使用

数据推送实现订单的下载,需要开通推送服务;

第五步:应用部署至VM

1) 远程登录VM服务器进行基础环境的部署,如开发工具、数据库客户端等;

2) 应用程序部署在VM上;(通过FTP上传,ftp端口21已开通)

第六步:数据迁移至RDS

1) 提前创建好RDS上的业务DB,可以在云portal操作;

2) 数据备份迁移至RDS上;

l MYSQL迁移方案:http://help.aliyun.com/manual?lastSortId=273

l Sqlserver迁移方案:

//open.taobao.com/doc/detail.htm?spm=0.0.0.0.llNGqj&id=101138

3) 数据检查:ISV技术人员自行检验下数据量以及表数量是否一致;

4) 数据库运行情况观察:主要是检查表索引、慢sql情况,需要系统运行的情况下进行。

第七步:系统验证

1) 程序微调整,比如修改RDS数据库链接地址等信息; 对于采用sessionkey保存本地的实现机制,切换一批新的用户重新授权的sessionkey

2) 功能测试:除了确保系统每个功能能正常使用,还要测试功能之前的互通运行是没问题的;

3) 性能测试:

目的:

  • 尽早发现系统瓶颈,推动登塔前改进以便避免登塔后出现大量退塔潮。
  • 提前发现系统问题,以备登塔后提供快速高效的售后服务做好准备。

以下的原因都可能会引起退塔或售后问题:

  • 登塔或系统出现访问卡死、链接超时
  • 因运行环境的变化,少数情况下也会出现核心功能模块出现性能问题。
  • 系统运维的问题。

通过登塔前的性能测试,未雨绸缪。让登塔后把退塔降到最低和提高服务体验

主要几个指标可以参考表:(表中的指标百分比都是基于用户订购的硬件规格计算,仅做初级参考,isv需要通过详细的压力测试评估出系统实际的耐压能力)

PS:后续聚石塔会提供性能测试工具及监控产品。

4) 安全测试:主要测试网络环境和系统端口开通情况;

第八步:系统上线试运行。

产品发布上线

产品按照聚石塔要求改造或开发完成,并且测试完成之后,淘点点商家需要把产品在服务平台发布对外售卖,发布之前类目小二会根据产品的完整度及功能丰富程度进行审核。

后续内容

1、商家切换入塔

1) 新淘点点合作方接入,无需做切换,商家直接在服务平台购买产品使用即可。

2) 对于已经在使用老系统的淘点点合作方

  • 对于saas模式,多个用户资源共享的系统,淘点点合作方告诉商家停止业务操作,淘点点合作方将系统访问域名指向聚石塔的IP,即可。
  • 对于线下部署,单个用户单套系统的。淘点点合作方协助将商家本地服务器的数据迁移至聚石塔内RDS,系统部署在VM上,域名切换指向塔内IP。完成之后用户重新登录系统授权范围即可。塔外的系统停止使用。

2、用户体验保障

如何保证和提升用户登塔后的系统使用体验,尽可能不出现退塔现象?需要淘点点合作方和聚石塔团队一起做好相应的售后服务工作。

用户入塔之后,影响用户体验的原因可能会有很多方面,比如系统不稳定,访问经常卡死或链接超时;登塔后,产品的业务功能执行变慢。所以在登塔后如何做好相应的监控保障工作,如下:

3、做好系统监控及时优化

1) 系统硬件资源监控

特别是saas模式部署的系统,因为硬件资源是共享的,所以批量用户大规模数据进入系统,会造成瞬间资源利用膨胀,比如服务器、数据库的内存不足;随着访问用户数量的增多出现数据库链接池满;服务器外网访问带宽不足等,这些可能会造成出现客户操作卡死、系统链接超时、甚至服务器宕机无法使用,这些都是直接影响用户体验的问题,所以淘点点商家要做好商家数据量及资源使用率的评估,并配合聚石塔的监控系统来避免这些问题:

  • 在聚石塔控制台做好告警设置(如图),每项监控报警值建议在所选机型最大值的70%-80%
  • 重点关注一下几个指标:

a 应用服务器(VM)带宽:用户线下使用的时候可能是通过局域网访问服务端不会考虑服务器带宽问题,入塔之后是通过互联网访问VM,除了受VM带宽的影响,还取决于商家运营环境的带宽;所以一旦批量用户访问VM很容易造成带宽极具上升,出现带宽不足;

b 磁盘空间:一般用户本地服务器磁盘空间要远大于用户实际可使用的空间大小,所以平时很少会出现空间不足的问题;但是到了聚石塔之后如果还是按照本地的使用率,可能就造成不足现象;

c RDS的连接数:一般淘点点商家本地安装的数据库是没有连接数限制的,而聚石塔内的RDS不同机型的都有个最大连接数;所以入塔之前评估好商家一次性最大的访问链接数量再进行;

优化方案:第一时间通过云portal的监控项检查RDSVM各个指标的使用情况,资

源不足的及时做弹性升级或机型升级://open.taobao.com/doc/detail.htm?id=101131

2) 代码质量及数据库监控

对于那种刚入塔不久,还做过系统架构改造的系统,可能还没对系统进行全面的测试观察,代码质量也没有经过大用户量的考验,所以一旦大批量用户同时进来,可能就马上出现卡死宕机的问题;如果有用户反馈这类现象,ISV技术人员第一时间可以从以下几点先做初步的分析:

  • 数据库执行计划改变:用户从本地数据库pgsql迁移至RDS之后,执行计划改变了,而导致执行时间剧增;

问题排查:通过explain查看sql的执行计划,查看是否有没建索引的字段,而引起大量的全表扫描,一步步进行优化;

  • 链接超时:可能是应用程序设计不是很好导致数据库锁争用较多;由于没有建立适当的索引引起全表扫描导致,造成数据库等待;

问题排查:通过查看数据库的监控指标,看是否有如下现象:

  • 隐式转换导致全表扫描:用户数据库存放在RDS中,网站访问数据库的时间较长,绝大部分都是程序设计不好,sql写的不优化,索引建立的不好导致;

问题排查:查看数据库的慢日志,提取慢sql,看超时情况,进一步优化;可参考RDS优化方案;

  • RDSCPU消耗过大,超出100%;通常情况都是因为慢sql导致,这里慢sql包括table scan,扫描数量过大,内存排序,磁盘排序,锁争用等待等;表现现象sql执行状态为:sending datecopying to tmp tablecopying to tmp table on disksorting resultlocked

解决方案:登陆至RDS,通过show processlist产看当前正在执行的sql,当执行完后出现大量的语句,查看是否有上面说的那些状态,这种

sql都是由性能问题的;

优化方案

A 数据库设计按照附件《聚石塔RDS范问规范》进行;

B 数据库性能异常,参考RDS优化方案

C、数据库RDS常见问题分析,参考《RDS常见问题分析》

【做好系统性能测试】

随着系统的使用商家量逐步的增加,随着聚石塔环境不断的进化,随着更多的云产品引入使用,需要及时对系统做耐压评估进行性能测试;

根据用户个性化要求预测系统的各个节点的期望值,如响应时间、吞吐量等等,进行完整的功能测试和性能测试。

【完善产品功能】

关注天猫新业务的发展,新数据的开放,及时增添系统的功能来满足用户多变的需求;

其他

1聚石塔常见问题FAQ 2云主机FAQ 3云数据库FAQ

 

 

FAQ

关于此文档暂时还没有FAQ
返回
顶部