Slide
Make the difference with Data
blabla
blabla
blabla
blabla
blabla
Dive In

Dive in and get involved in our projects or create a new one!

18-04-2023


聚光灯项目


Slide

Take a look at our Cross-Lingual projects

Automatically computed metonymy relationship for over 150 languages

A large scale, automatically build database of over 8 billion cognate pairs in 338 languages

Cross-lingual Projects
Universal Metonymy
CogNet
Slide

A large-scale multilingual database of derivational and inflectional morphology

A freely available lexico-semantic resource for the mongolian language

A free, high performance transliteration tool for over 180 languages and 60 writing systems

MorphyNet
Mongolian WordNet
WikTra
previous arrow
next arrow

什么是公民科学社区?

公民科学社区由自愿帮助进行科学研究的人组成。公民科学家可能会参与研究过程的各个方面,例如设计实验、收集数据、分析结果和解决问题。

什么是数据科学?

DataScientia 是一个公民科学社区,由有兴趣为自己和社会贡献、了解和影响未来数据驱动的人工智能 (AI) 技术演进、迈向更美好世界的人们组成。查看更多

我们希望达到什么目的?

我们希望实现一个过程,在这个过程中,任何人都可以提高他们对当前数据驱动的人工智能技术创新的认识和积极参与。技术创新应由社会创新驱动,公民应积极参与社会创新议程的制定。 查看更多

谁是我们社区的成员?

任何人都可以成为 DataScientia 社区的成员。您不需要任何特定技能即可成为会员。唯一的要求是你必须愿意了解数据、人工智能及其对社会的影响。你可以根据你想学多少和多快来决定投入的努力量。

你可以如何贡献?

至少有四种不同类型的贡献。您可以选择最适合您的能力、技能和兴趣的一项或多项。

  • 第一种贡献是支持收集以人为中心的数据,这是我们开展的众多实验之一所需要的。
  • 第二种,如果你有编程技能,就是参与开放数据和开源社区,负责开发AI工具和软件,让DataScientia和它的合作伙伴可以运作。
  • 查看更多

我们如何帮助您做出贡献?

我们可以通过四种主要方式为您提供帮助。

  • 首先是我们为您提供教育材料和支持,帮助您了解数据驱动人工智能的基本概念及其对人们生活和社会的影响。
  • 第二,我们支持您收集、管理和共享您和整个社区生成的以人为本的数据。
  • 查看更多
people_grid

目录


Live Data

Live People

LM-noBG

Live Media

Live Language

Live Knowledge

关于什么的数据?

我们收集有关人以及他们周围的世界和社会的数据。

我们收集哪些类型的数据?

我们收集的数据可分为四种基本类型:

  1. 描述世界呈现给我们的方式的媒体。
  2. 描述我们如何陈述世界情况的数据,即什么是真什么是假。
  3. 关于我们用来描述世界多样性的语言的数据。
  4. 关于我们用来提供关于世界数据多样性的统一视图的知识的数据,这是以目的为导向的数据组合的关键。

服务


我们用数据做什么?

我们遵循端到端的数据管理流程,涵盖从收集到使用再到创新的所有阶段。该过程分为五个主要步骤:

Coming soon...
Coming soon...
Coming soon...
Coming soon...
  • 我们收集它们
  • 我们储存它们
  • 我们使第三方能够找到它们
  • 我们做目的驱动的数据组合。
  • 我们将它们分配给技术支持的社会创新
Coming soon...
Coming soon...
UKC
Coming soon...
Coming soon...

我们不追求客观性。相反,我们想研究世界的局部表征是如何出现的,以及它们如何被组合成目的驱动的单一表征。重点是发生这种情况的过程。

Coming soon...
Coming soon...
即將推出
Coming soon
distributed-team

我们是如何组织的?

DataScientia 是一个非营利组织,其目标是建立一个更美好、更具包容性的社会,以实现由数据驱动的 AI 支持的社会创新。 DataScientia 与其合作伙伴大学密切合作。大学支持 DataScientia 的终身教育计划、当地社区的发展和支持以及研究和创新活动。 查看更多

我们如何维持自己?

DataScientia 的目标是根据其实现的技术和社会创新所产生的收入来维持自身,主要侧重于其自身的端到端数据管理流程。 DataScientia 有两个主要收入来源。

  • 首先是提供由 DataScientia 开发的数据和技术支持的服务。每种类型的数据都支持不同的数据特​​定服务。
  • 二是支持依托自身技术优势的高创新企业创业成长。

DataScientia 的所有经济收入都必须遵循符合其内部道德标准的流程。收入必须来自产生有意义的社会创新的活动。

DataScientia 的最终目标是找到一种方法来超越当前仅由技术驱动、不了解多样性的 AI 创新方法


DataScientia 宣言


通過多樣性團結

  1. 數據,因為它們可以在互聯網上獲得,是推動一個新的、更智能的社會崛起的燃料,我們希望這個社會更加開放、包容,並實現更好的生活質量。
  2. 每個人都應該能夠以負擔得起的成本獲得和重複使用數據,而不受性別、宗教、國籍、財富水平或任何其他偶然因素的影響。
  3. 數據應適當地代表所感知世界的多樣性,因為它們源於當地文化和傳統、需求和目的。數據應以當地語言表達,並應記錄那些與上下文相關的事實,並採用最合適的格式和值。
  4. 知識應該將數據的多樣性吸收到其基礎統一性的逐漸更統一的表示中。
  5. 知識和數據的開發應歸功於利益相關方的自願努力,每一方都以完全自主的方式運作。
  6. DataScientia 是一個非營利組織,其目標是開發一種基礎設施,支持以數據為代表的單一知識驅動的多樣性理解的出現。
  7. DataScientia 的首要目標是技術基礎設施。
  8. DataScientia 的第二個目標是通過開發和採用共享的最佳實踐來構建組織基礎架構。
  9. DataScientia 的第三個目標是法律基礎設施,處理與許可和隱私相關的問題等。
  10. DataScientia 的第四個目標是社會基礎設施,即以理解數據、數據開發和利用為中心的社會和經濟社區。

DataScientia - Unitas per veritam

“DataScientia”,“Scientia per Data”的拉丁文,意為“通過數據獲取知識”。

“Scientia”,來自 sciens,是 scio 的現在分詞,意思是知道、了解 - 與 conscientia 同根,意思是與他人分享的知識和自己內心的知識。

“數據”,datum 的複數形式,意思是給定的,我們認為理所當然的思維基礎——我們在這裡將其視為世界的數字表示。

“Unitas per Varietatem”,“通過多樣性實現統一”的拉丁文 - 我們如何通過理解和感謝數據的多樣性來實現知識的統一?