闪电般的统一分析引擎

Project and Product names using "Spark"

创建用于Apache Spark的产品和项目的组织以及相关的营销材料,应注意尊重" Apache Spark"中的商标及其徽标. 有关正确使用ASF商标的全面而权威的指南,请参阅ASF商标指南和相关的FAQ .

完全不包含" Spark"的名称在Spark项目中没有潜在的商标问题. 建议这样做.

诸如" Spark BigCoProduct"之类的名称不正确,通常包括" Spark"的名称也一样. 但是,上面的链接描述了一些例外情况,例如"由Apache Spark支持的BigCoProduct"或" Apache Spark的BigCoProduct"之类的名称.

创建软件标识符(Maven坐标,模块名称等)(例如" spark-foo")是一种常见的做法. 这些是允许的. 也始终允许在说明中名义上使用商标,例如" BigCoProduct是Apache Spark的小部件".

Companies and Organizations

要将自己添加到列表中,请通过电子邮件发送给dev@spark.apache.org其中包含您的组织名称,URL,正在使用的Spark组件列表以及用例的简短描述.

  • 加州大学伯克利分校AMPLab-最初推出Spark的大数据研究实验室
    • 我们正在Spark上构建各种开源项目
    • 我们有研究生和一组专业软件工程师在堆栈上工作
  • 4Quant
  • Act Now
    • Spark为NOW APPS(大数据,实时,预测性分析平台)提供动力. 我们将Spark SQL,MLlib和GraphX组件用于批处理ETL和应用于电信数据的分析,从而为运营商提供更快,更有意义的见解和可行的数据.
  • Agile Lab
    • 增强大数据. 360客户视图,日志分析,BI
  • Alibaba Taobao
    • 我们在YARN生产集群上构建了世界上第一个Spark.
  • Alluxio
    • Alluxio(以前是Tachyon)是世界上第一个以内存速度统一不同存储系统的系统.
  • Amazon
  • Art.com
    • 趋势分析和个性化
  • AsiaInfo
    • 我们正在使用Spark Core,Streaming,MLlib和Graphx. 我们利用Spark和Hadoop生态系统为电信行业以及其他工业领域的客户构建经济高效的数据中心解决方案.
  • atp
    • 预测模型和学习算法可提高程序化营销的相关性.
    • 使用的组件:Spark SQL,MLLIb.
  • Autodesk
  • Baidu
  • Bakdata –使用Spark(和Shark)执行大型数据集的交互式探索
  • 大型工业公司 -使用Spark Streaming:大型内容平台是一项企业对企业内容资产管理服务,可提供实时新闻,公共领域媒体和内容档案的可搜索汇总来源.
  • Celtra
  • ClearStory数据 – ClearStory的平台和集成的Data Intelligence应用程序利用Spark加快了对内部和外部数据源的分析,从而获得了全面且可行的见解.
  • Concur
    • Spark SQL,MLlib
    • 使用Spark进行差旅和费用分析以及个性化<
  • Content Square
    • 我们使用Spark定期读取原始数据,将其转换为Parquet,并对其进行处理以创建高级分析仪表板:聚合,采样,统计计算,异常检测,机器学习.
  • Conviva –现场直播
  • Credit Karma
    • 我们使用Spark创建个性化的体验.
  • Databricks
    • 由Apache Spark的原始创建者组成的Databricks致力于扩展开源项目并简化大数据和机器学习. 我们坚定地致力于将所有工作保持在Spark开源上.
    • 我们提供了一个经过云优化的平台 ,可在Amazon Web Services和Azure上运行Spark和ML应用程序,并提供了全面的培训计划 .
  • Dianping.com
  • Drawbridge
  • eBay Inc.
    • 使用Spark核心进行日志事务聚合和分析
  • Elsevier Labs
    • 用例:构建机器读取管道,知识图,内容即服务,内容和事件分析,基于内容/事件的预测模型和大数据处理.
    • 我们的大部分工作都是通过Databricks Notebook使用Scala和Python.
  • EURECOM
  • Exabeam
  • Faimdata
    • 在Spark / Shark / Spark Streaming之上为零售行业构建电子商务和数据智能解决方案
  • Falkonry
  • Flytxt
    • 大数据分析,用于电信领域的用户配置和个性化. 我们正在使用Spark Core和MLlib.
  • Freeman Lab at HHMI
    • 我们正在使用Spark实时分析和可视化大规模大脑活动记录中的模式
  • Fundacion CTIC
  • Groupon
  • GoDataDriven
    • 阿姆斯特丹的咨询公司帮助公司在Spark上取得成功
  • Guavus
    • 网络机器数据的流处理
  • Hitachi Solutions
  • The Hive
  • IBM Almaden
  • InfoObjects
    • Award winning Big Data consulting company with focus on Spark and Hadoop
  • Inspur
  • Istanbul Sehir University
  • Kenshoo
    • 数字营销解决方案和预测性媒体优化
  • Kelkoo
    • 使用Spark Core,SQL和流. 产品推荐,BI和分析,实时恶意活动过滤以及数据挖掘.
  • Knoldus Software LLC
  • Localytics
    • 批处理,实时和预测性分析推动了我们的移动应用程序分析和市场营销自动化产品.
    • 使用的组件:Spark,Spark Streaming,MLLIb.
  • MediaCrossing –纽约和波士顿地区的数字媒体交易专家
    • 我们正在使用Spark作为Hadoop Map / Reduce的替代产品,以在更短的时间内获得正确的查询答案.
  • MyFitnessPal
    • 使用Spark通过显式和隐式用户信号清理用户输入的食物数据,最终目的是识别高质量的食物.
    • 使用Spark构建针对食谱和食品的不同推荐系统.
  • NASA JPL - Deep Space Network
  • Netease
  • Nokia Solutions and Networks
  • NTT DATA
  • Nube Technologies
    • Nube提供大规模数据管理解决方案,帮助客户定位,准确的库存和有效的分析.
  • Ooyala,Inc. –在所有屏幕上提供个性化视频体验
  • Opentable
    • 使用Apache Spark进行日志处理和ETL. 获得的数据将馈入由Spark MLLIB Matrix Factorization支持的推荐系统. 我们正在评估使用Spark Streaming进行实时分析.
  • PanTera
    • PanTera是用于探索大型数据集的工具. 它使用Spark创建从数百万到数十亿个数据点的XY和地理散点图.
    • 我们正在使用的组件:Spark Core(Scala API),Spark SQL和GraphX
  • PlanBMedia
  • Apache PredicitionIO
    • PredictionIO当前为Apache Spark MLlib提供两个引擎模板,用于推荐(MLlib ALS)和分类(MLlib Naive Bayes). 使用这些模板,您可以创建自定义预测引擎,以有效地进行生产部署.
  • Premise
  • Quantifind
  • Radius Intelligence
    • 将Scala,Spark和MLLib用于Radius营销和销售智能平台,包括所有美国企业的数据聚合,数据处理,数据集群,数据分析和预测建模.
  • Real Impact Analytics
    • 为电信运营商构建大规模分析平台
  • RocketFuel
  • RONDHUIT
  • Sailthru
    • 使用Spark建立用于营销自动化和个性化的预测模型和推荐系统.
  • Samsung Research America
  • Shopify
  • Simba Technologies
    • 适用于Spark的BI /报告/ ETL及以后
  • Sinnia
  • SK Telecom
    • SK Telecom使用Spark和Shark分析客户的移动使用模式.
  • Sohu
  • Stanford DAWN
    • 针对可用机器学习的基础设施的研究实验室,其中有多个运行或加速Apache Spark的研究项目.
  • Stratio
    • 提供围绕Apache Spark的开源大数据平台.
  • Taboola –在网络上为"您可能喜欢的内容"提供支持
  • Tencent
  • Tetra Concepts
  • TrendMicro
  • TripAdvisor
  • UC Santa Cruz
  • University of Missouri Data Analytics and Discover Lab
  • VideoAmp
    • 面向在线和电视观众的智能视频广告.
  • Vistar Media
    • 定位技术公司,帮助品牌吸引不断发展的消费者
  • Yahoo!
  • Yandex
  • Zaloni
    • Zaloni的数据湖管理平台(Bedrock)和自助数据准备解决方案(Mica)利用Spark来快速执行转换和数据浏览.

by  ICOPY.SITE