DBC中期计划
应用技术
缓存
自动讯价
多线程、并行计算
向量空间模型
平行计算
云计算
百度、Google搜索及索引技术
分布部署
测试驱动
迭代开发
工作内容
需求
设计
开发
测试
组内测试
数据库维护
文档维护
工作制度、流程
预算
资源
人员
DBA
工作安排
充分利用,减少闲置
不绝对,配合测试需要预留
风险预留
预留时间来进行技术储备、组内测试
明确绩效标准
需要公司支持
量化指标
硬件
服务器
带宽
RAID
集群
测试驱动
打造数据网关
为客户提供优质可靠的商品、服务价格
有竞争力的价格
贴心服务
开发时间表及milestone
时间倒排
进度表
我在做什么?还能做什么?
以联嘉云网为出发点
眼放远
心放宽
目标
电子商务
指标
量
供货商100家
数据
千万
准
查询准确99%
价格准确99%
合并80%
半自动化
分词90%
速
实时性
与供货商同步
价格
信息
上下架
已有供货商前10页热卖商品采集
搜索毫秒级
Subtopic
策略、措施
工作项
搜索
范围搜索的优化
辅助搜索字段
重构
分类统计
lucene优化
采集
供货商数据分类
行业前3
确定供货商采集优先级
评论采集
保证频道覆盖率
C++>C#
品牌、型号为合并依据
这两个关键信息,提取单独处理模块。
脚本
目录
便于查找、更新信息
分类:供货商、频道
维护计划
数据组各项目公共部分提取
架构Review
数据采集客户端
数据合并
合并标准为品牌、商品型号
讯价
商品
购物车页
服务
机票
酒店
票务
大麦网
中国票务通
接口
讯价取商品最低价
取多个商品价格(推荐商品)
指定商品在各供货商售价格比较
商品价格更新
编辑热门商品
单个性能要优于多个
讯价的规则
不讯价的情况
3小时内更新的热门商品
1天内更新的非热门商品
自动讯价频率
热门商品2小时一次
非热门商品1天一次
异常处理
讯价无结果使用原价格
延迟加载
讯价按功能按供货商及频道进行分类,便于维护。
索引创建
压缩
数据整理
体检
租车
数据库管理
非关系型数据库
数据分析
供货商评级
热门商品
服务质量
联嘉商品讯价
测试数据准确
现有数据结构修改
增加热门商品记录字段
GoodsInfo表加标识字段
索引加标识字段
商品分类
热门商品
非热闹商品
货比三家
供货商维护
合约
时间
范围
比例
到期供货商商品自动下架
数据接口
列表、单一、相关商品
jave lucene 分词
工作优先级
以产生效果快速、显著排序
储备
Java Lucene测试