March 25, 2009 · News · 1 comment

数据挖掘研究院(网址:http://www.dmresearch.net) 由中科院合肥分院相关研究人员发起,建立于2004年4月。数据挖掘研究院网络平台由最初的一个BBS发展到现在的专业性的门户网站,网站会员近六万人,其中硕士研究生以上学历占70%,博士以上学历占30%,会员包括国内知名高校以及国外留学人员,其中美国、日本、新加坡等地会员比较活跃。

数据挖掘研究院 以 数据挖掘研究交流为初衷,在发展的过程中也一如既往的在中国为数据挖掘布道,为推动数据挖掘在中国的发展做出了一定的贡献。

经历了五年的风风雨雨,很遗憾我们没有做大,但是很高兴数据挖掘研究院一直在做得更好,相信随着数据挖掘技术在国内外的广泛应用我们也会做得更好。

数据挖掘研究院 愿与各方合作,在中国共同推广应用数据挖掘技术,同时 数据挖掘研究院 愿与 企业 和 高校 在以下领域进行深度合作交流:

1. 数据挖掘产品研发;
2. 数据挖掘产品的推广应用;
3. 数据挖掘培训;
4. 数据挖掘技术攻关;

如果你有以上或者其他更多关于数据挖掘方面的问题,欢迎和我们联系。

欢迎数据挖掘公司加入 数据挖掘研究院商业中心,本中心主要是为了汇集国内外知名数据挖掘企业,为企业做宣传,做企业合作交流的媒介,为企业找客户,为客户找企业。
联系方式 : http://www.chinakdd.com/?page_id=4

May 7, 2009 · Jobs · (No comments)

Opportunity for PhD study with full scholarship available at the Dept. of Computer Science, Southern Illinois University Carbondale (http://www.siuc.edu/).

Research directions include (but not limited to): Database, Data Mining, and Bioinformatics.

Requirements (with exceptions for outstanding applicants): completed Master degree (in CS, Math or related areas); GPA (last two years) 3.25; TOEFL score 550 (paper/220 or computer based/80 iBT) or IELTS score 6.0; GRE score 700 (on the Quantitative) with Writing 4.0 (considering 3.0).

Interested students please send email to Dr. Che at dche@cs.siu.edu.

May 4, 2009 · Jobs · (No comments)

Job Position:  Senior CRM Date Analyst - APAC

Client:   L’Oreal

Report to:   Internet & CRM Director

Location:   Shanghai

Main Objective

  • Directly reporting to the Internet & CRM Director, he/she will be in charge of supporting L’Oreal APAC brands in designing, optimizing and running their CRM programs
  • Acting as an internal consultant, he/she will help the brands:
  • to better understand their customers
  • to identify new customer clusters to target
  • to design & implement relevant business cases in countries willing to launch CRM programs

Responsibilities

  • Help brands to design / optimize relevant customer segmentation and scoring
  • Implement valid and consistent ROI measurement methodologies across brands and countries (control groups, regular surveys, customer life time value)
  • Constantly analyzing campaigns efficiency and make recommendations for improvement
  • Run transversal / multi-brands analysis in order to detect new business opportunities
  • Guaranteeing the data cleanliness and consistency
  • Analyzing all data-related issues and provide support to IT team in problem solving

Requirements

  • Eight to ten years of experience in data-mining & data-analysis in Distant sales / Direct marketing  / Bank / Insurance / Telecom companies
  • Strong statistical & analytical skills
  • Excellent business understanding & sensitivity
  • Have already managed operationally some CRM / loyalty programs
  • Excellent English
  • Some knowledge about Siebel technology would be a plus

Byron ZHANG ( )

TEL:                   +86 21 6256 1372/6256 3113*29

Mobile:              +86 135 8559 6590

E-mail: byron.zhang@career-mentor.com

May 2, 2009 · Jobs · (No comments)

我们的要求:
计算机相关专业大学本科以上学历,具有扎实的计算机基础理论知识;

. 精通C/C++语言,具有丰富的Unix/Linux平台开发经验;

. 精通Perl、Python、Shell等其中一种脚本语言;

. 有较好的的算法和数据结构基础,以及独立解决问题的能力;

. 熟悉搜索相关技术或分布式计算;

. 熟悉机器学习和NLP技术者优先(请在简历中具体说明相关项目经历和工作职责);

. 良好的沟通能力和团队精神。

请将简历发到xyzgrid@yahoo.com.cn 谢谢。

May 2, 2009 · Jobs · (No comments)

招聘公司当当网,工作地点在北京北二环安定门地铁站
交通十分便利,时间十分弹性,待遇十分优厚
作为实习工程师,需要每周至少工作4天(周一至周五),跨度3~6个月

您可以获得:
1、具有竞争力的实习待遇,(即便同外资IT企业相比,实习待遇也处于中上水平)
2、深入参与开发具有挑战性、前瞻性的互联网产品,牵涉到搜索、数据挖掘相关技术

具体工作内容如下,有兴趣的可以发简历到dangdangintern@yahoo.cn
请在标题注明,申请的是PHP实习生,还是 C++实习生,谢谢

实习岗位1:PHP实习生的工作内容

1. 基于PHP/MySQL/Linux的主站程序设计和开发;

2. 基于xhtml/css/javascript/Ajax的前端开发;

3、前瞻性的用户交互性较强的电子商务平台类产品

实习岗位2:C++实习生的工作内容

1、商品搜索引擎相关系统的技术开发工作

2、个性化购物推荐系统的相关技术开发工作

希望您:

1、名校或重点大学在读理工科研究生,时间充裕,需要每周至少工作4天,跨度3~6个月

2、PHP岗位:具备至少2年左右的LAMP相关开发经验,扎实的Linux系统开发基础
能手写xhtml/css/javascript代码

C++岗位:具备扎实的算法与数据结构基础、最佳10万行左右的C/C++编码经验

4、优先考虑具备如下经验者:
Linux下C/C++编程经验 或者 熟练使用Perl/Python
或者熟悉Memcached/Apache/Lighttpd 或者 熟悉MySQLDB的海量数据管

April 3, 2009 · Company · (No comments)

公司网站:http://www.ezecho.com/company.html

Ezecho成立于2006年初,并开始为制药企业提供专业的语意化搜索引擎服务。2007,获得美国红鲱鱼亚洲100技术创新公司奖项。

2008年初,于美国加州注册为Ezecho Technology, 在原搜索引擎服务的基础上推出了全新的产品EZ-Knowledge,为企业提供基于语意化搜索的产品、文献、服务解决方案

2008年中, Ezecho Technology再次扩充产品线, 为个人及企业级用户提供一步到位的数据管理及数据统计分析平台,该数据平台凭借其简单易用的用户界面、详尽的用户导航、灵活配置的算法及专业的结果获得了众多国际知名制药企业的青睐。

Ezecho Technology将会继续努力,在现有产品线的基础上提供更多专业化企业级服务系统。
我们的软件和服务可帮助企业:

  • 提高运营效率
  • 保持公司战略与日常执行的协调一致
  • 增强与客户、合作伙伴和供应商的可赢利关系
  • 强化自己的产品和服务,使之脱颖而出

我们的部分解决方案包括:

  • 财务和利润分析
  • 市场和销售绩效分析
  • 客户和供应商分析
  • 科学数据分析

我们的价值
我 们是客户值得信赖的合作伙伴。我们拥有无比雄厚的技术实力。我们一向奉行科学统计方法,高效分析。我们倾听客户意见并帮助客户预测(并充分利用)行业的起 伏波动规律。凭借我们的行业地位和专业能力,我们能较早的洞察业内新发展,有效地综合各种认识,成功为客户推荐最佳解决方案。

通过多年来与客户的合作,我们深刻洞察及把握各类专业化业务流程,是各类复杂和重要任务系统的专家。我们的解决方案在同类别中一向处于领先地位。我们在医学统计、金融统计、销售统计等领域拥有最广泛的业内最佳解决方案组合。

我们努力在创新和实用之间达到平衡。我们将最先进且经久验证的技术深入且广泛地融入行业功能。我们通过产品开发和整合,不断完善我们的解决方案。
我们的目标
我们通过深刻洞察客户的专业化业务流程,灵活并有效的利用数据统计分析,致力帮助客户实现机构目标。

我们的软件、服务和解决方案可帮助客户对业务流程和决策进行自动化改进,使客户在竞争中脱颖而出,为其公司创造与众不同的特色。

我们可提供定制的解决方案,为客户独特的业务策略提供支持-帮助客户提高效率及通过创新把握增长机会、改善客户服务并符合监管规定。

March 26, 2009 · Blogger · (No comments)

偶然在  guwendong 的博客上看到一些关于web推荐系统的文章,加之个人在之前对这方面比较感兴趣,索性利用手头上的博客资源整理一份材料供大家参考。

以下内容仅作科普资料,如果需要达到具体项目的可执行阶段还需要看一下书籍资料上具体的算法实现和案例剖析。

A.关于推荐系统的综述说明

  1. 推荐系统:主要推荐方法
  2. 电子商务推荐系统入门基础
  3. 电子商务推荐系统研究综述
  4. Collaborative Filtering
  5. 为什么基于项目的协同过滤是稳定的.
  6. 个性化推荐系统的研究进展[和朋友一起写的小综述]
  7. 推荐系统:协同过滤之user-based collaborative filtering
  8. 数字化信息服务中个性化与共享理念分析
  9. 国内外个性化推荐系统研究现状
  10. 心理测试与内容推荐
  11. 社群网络分析(social network analysis; sna):追踪相互关系

….

B.关于推荐系统的算法说明

  1. Slope One算法
  2. 协同过滤学习笔记: 稀疏?
  3. 基于用户兴趣局部相似性的协同过滤推荐算法(一)
  4. 协同过滤 – 基于用户的协同过滤系统
  5. 智能推荐系统技术研究
  6. 最近的Collaborative Filtering 实践结果.

C.关于推荐系统的案例说明

  1. 广告投放与推荐系统
  2. 基于项目评分预测的协同过滤推荐算法
  3. 基于Slope One的相关歌曲推荐算法
  4. 好友关系推荐
  5. FeedzShare推出个性化阅读
  6. Audiobaba - 结合音乐推荐的社会化音乐搜索引擎
  7. 信息推荐概念及其应用实例
  8. an excellent blog about recommender system
  9. SharedBook Unveils Enhanced Book Personalization Web Site

….

March 26, 2009 · Blogger · (No comments)

Business Intelligence or Business Analytics?

As SAS talked about its business analytics framework it became clear that they envision the results of data mining and predictive analytics (where they genuinely have offerings superior to almost everyone) will be delivered in reports or dashboards. This is what I have somewhat dismissively called “predictive reporting” and while it is better than purely historical reporting, it does not do much to make every decision analytically based as it leaves out the decisions made by machines (which don’t read reports) and those made by people with too little time to read a report (most call center or retail staff, for instance) or no skill at interpreting it.

Does coverage matter?

In response to Andrew Gelman’s extended April Fool’s diatribe on Objections to Bayesian Statistics, Larry Wasserman commented regarding physicists who want  guaranteed frequentist coverage for their confidence intervals that  “Their desire for frequentist coverage seems well justified. Someday, we can count how many of their intervals trapped the true parameter values and assess the coverage. The 95 percent frequentist intervals will live up to their advertised coverage claims. A trail of Bayesian intervals will, in general, not have this property”.

March 25, 2009 · Blogger · (No comments)

Data Mining Survey - Last Call

Rexer Analytics has just issued a last call for its annual data mining survey. This is a pretty nice survey that provides a great deal of valuable information about how data mining is used and who is doing it. To participate, please click on the link below and enter…

Trust, Risk, Reputation and Recommendation on the Web

Thoughts on Understanding Neural Networks

How many software packages is too much?

Twitter in Web Search

数据挖掘分类算法的比较

数据挖掘与人权

Meeting with the father of Data Mining Process(数据挖掘过程之父Fayyad)