ডিএসপিএল বিকাশকারী গাইড

DSPL মানে ডেটাসেট পাবলিশিং ল্যাঙ্গুয়েজ। এটি মেটাডেটা (ডেটাসেট সম্পর্কে তথ্য, যেমন এর নাম এবং প্রদানকারী, সেইসাথে এতে থাকা ধারণা এবং প্রদর্শন) এবং ডেটাসেটের প্রকৃত ডেটা উভয়ের জন্যই একটি উপস্থাপনা বিন্যাস। এই বিন্যাসে বর্ণিত ডেটাসেটগুলি Google পাবলিক ডেটা এক্সপ্লোরার -এ আমদানি করা যেতে পারে, একটি টুল যা ডেটার সমৃদ্ধ, ভিজ্যুয়াল অনুসন্ধানের অনুমতি দেয়৷

দ্রষ্টব্য: পাবলিক ডেটা আপলোড টুল ব্যবহার করে Google পাবলিক ডেটাতে ডেটা আপলোড করতে, আপনার একটি Google অ্যাকাউন্ট থাকতে হবে।

এই দস্তাবেজটি সেই সমস্ত ডেটা মালিকদের জন্য যারা তাদের বিষয়বস্তু পাবলিক ডেটা এক্সপ্লোরারে উপলব্ধ করতে চান৷ এটি DSPL স্কিমা এবং সমর্থিত বৈশিষ্ট্যগুলির বিশদ বিবরণে গভীরভাবে ডুব দিয়ে টিউটোরিয়ালের বাইরে চলে যায়। XML-এর শুধুমাত্র একটি প্রাথমিক পরিচিতি ধরে নেওয়া হয়, যদিও রিলেশনাল ডাটাবেসের জ্ঞানও দরকারী।

যদিও এটি প্রয়োজনীয় নয়, আমরা এই নথিটি দেখার আগে টিউটোরিয়ালটি পড়ার পরামর্শ দিই, যা ছোট এবং সহজে হজম হয়৷

ওভারভিউ

একটি DSPL ডেটাসেট হল একটি .zip ফাইল যাতে একটি XML ফাইল এবং CSV ফাইলের একটি সেট থাকে। CSV ফাইলগুলি হল সাধারণ টেবিল যাতে ডেটাসেটের ডেটা থাকে, যখন XML ফাইল ডেটাসেটের মেটাডেটা বর্ণনা করে৷ পরবর্তীতে তথ্যগত মেটাডেটা যেমন পরিমাপের বর্ণনা, সেইসাথে টেবিলের মধ্যে রেফারেন্সের মতো কাঠামোগত মেটাডেটা অন্তর্ভুক্ত। এই মেটাডেটা অ-বিশেষজ্ঞ ব্যবহারকারীদের আপনার ডেটা অন্বেষণ এবং কল্পনা করতে দেয়।

প্রক্রিয়া

সাধারণভাবে, একটি DSPL ডেটাসেট তৈরির প্রক্রিয়াটি নিম্নরূপ (কিছু পদক্ষেপ সমান্তরালভাবে ঘটতে পারে):

  1. আপনার DSPL XML ফাইল তৈরি করুন।
  2. আপনার ডেটাসেটে ব্যবহার করার জন্য কোনও বাহ্যিক ডেটা উত্স সনাক্ত করুন৷
  3. আপনার ধারণা, স্লাইস, এবং (ঐচ্ছিকভাবে) বিষয়গুলি সংজ্ঞায়িত করুন। পুনরাবৃত্তিমূলকভাবে আপনার DSPL ফাইলের বিষয়বস্তু আপডেট করুন।
  4. আপনার উৎস ডেটা .csv ফাইলগুলিতে রপ্তানি করুন৷
  5. একটি DSPL ডেটাসেট তৈরি করুন।
  6. Google-এ ডেটাসেট জমা দিন।

XML স্ট্রাকচার

ওভারভিউ

DSPL XML ফাইলটি ধারণা, স্লাইস, বিষয় এবং টেবিলের মধ্যে কাঠামোগত সম্পর্ক সহ ডেটাসেটের মেটাডেটা সংজ্ঞায়িত করে। যদিও এই ফাইলটি হাতে তৈরি করা সম্ভব, ডেটা প্রক্রিয়াকরণ সরঞ্জাম এবং স্ক্রিপ্টগুলি প্রক্রিয়াটিকে ব্যাপকভাবে প্রবাহিত করতে পারে। একটি নতুন উইন্ডোতে একটি নমুনা DSPL ফাইল দেখুন

ফাইলটিতে বেশ কয়েকটি বিভাগ রয়েছে, যা নীচের সারণীতে সংক্ষিপ্ত করা হয়েছে। সারণী অনুসরণ করে, আমরা প্রাক্তন প্রতিটিকে আরও বিশদে বর্ণনা করি।

অধ্যায় সারসংক্ষেপ অধিক তথ্য
হেডার এবং আমদানি ডেটাসেটের অন্যান্য উপাদানগুলির জন্য অভিভাবক৷ ডেটাসেটের জন্য টার্গেট নেমস্পেস (অর্থাৎ, শনাক্তকারী) অন্তর্ভুক্ত করে, সাথে যেকোনো আমদানি করা ডেটাসেটের নামস্থান। ডকুমেন্টেশন
ডেটাসেট তথ্য ডেটাসেটের নাম, বিবরণ এবং URL। ডকুমেন্টেশন
প্রদানকারী তথ্য ডেটাসেট প্রদানকারীর নাম, বিবরণ এবং URL। ডকুমেন্টেশন
ধারণা

ডেটাসেটে প্রদর্শিত "জিনিস" এর সংজ্ঞা (যেমন, দেশ, বেকারত্বের হার, লিঙ্গ, ইত্যাদি)

প্রতিটি ধারণার একটি অনন্য শনাক্তকারী রয়েছে, যা স্লাইস এবং টেবিল দ্বারা উল্লেখ করা যেতে পারে।

ডকুমেন্টেশন
স্লাইস

ধারণাগুলির সংমিশ্রণ যার জন্য ডেটাসেটে পরিসংখ্যানগত ডেটা রয়েছে৷ প্রতিটি স্লাইসে মাত্রা এবং মেট্রিক্স রয়েছে।

স্লাইস রেফারেন্স ধারণা এবং এছাড়াও টেবিল, যা প্রকৃত তথ্য ধারণ করে। প্রতিটি স্লাইসের একটি অনন্য শনাক্তকারী রয়েছে যা প্রকৃত ডেটা ধারণকারী টেবিল দ্বারা উল্লেখ করা যেতে পারে।

ডকুমেন্টেশন
টেবিল ধারণা এবং স্লাইসের জন্য ডেটা সংজ্ঞায়িত করুন। কনসেপ্ট টেবিল গণনা ধারণ করে এবং স্লাইস টেবিলে পরিসংখ্যানগত তথ্য থাকে। টেবিলগুলি XML ফাইলে সংজ্ঞায়িত করা হয় এবং প্রকৃত ডেটা ধারণকারী .csv ফাইলগুলির দিকে নির্দেশ করে৷ ডকুমেন্টেশন
বিষয় ডেটাসেট ধারণাগুলি সংগঠিত করার জন্য বিভাগগুলি৷ প্রয়োজন না হলেও, এগুলি আপনার ডেটা নেভিগেট করার জন্য ব্যবহারকারীদের জন্য খুব সহায়ক হতে পারে৷ ডকুমেন্টেশন

হেডার এবং আমদানি

পাবলিক ডেটা নামস্থান ঘোষণা করা হচ্ছে

একটি DSPL ডেটাসেট একটি শীর্ষ-স্তরের, <dspl> উপাদান দিয়ে শুরু হয়। এটি সমস্ত ডেটাসেট তথ্য আবদ্ধ করতে এবং ফাইল জুড়ে ব্যবহার করা হবে এমন কোনও নামস্থান নির্দেশ করতে ব্যবহৃত হয়। এখানে উদাহরণ:

<?xml version="1.0" encoding="UTF-8"?>
<dspl targetNamespace="http://www.example.com/mystats"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xmlns="http://schemas.google.com/dspl/2010" >
    ...
</dspl>

একটি নামস্থান হল একটি অনন্য শনাক্তকারী যা একটি XML স্কিমার সাথে যুক্ত হতে পারে (এক্সএমএল উপাদান এবং বৈশিষ্ট্যগুলির একটি সেট)। targetNamespace একটি URI প্রদান করে যা আপনার ডেটাসেটকে শনাক্ত করে। এই URI-এর কোনো প্রকৃত সম্পদের দিকে নির্দেশ করার প্রয়োজন নেই, তবে আপনার বিষয়বস্তু বা ডেটাসেট বর্ণনা করে এমন একটি নথিতে URI সমাধান করা একটি ভালো ধারণা।

আপনাকে একটি targetNamespace প্রদান করতে হবে না। যদি আপনি না করেন, তাহলে আমদানির সময় আপনার জন্য একটি স্বয়ংক্রিয়ভাবে তৈরি হবে।

targetNamespace অ্যাট্রিবিউটটি ফাইলে ব্যবহার করা হবে এমন অন্যান্য এক্সএমএল স্কিমা নির্দিষ্ট করে xmlns অ্যাট্রিবিউটের একটি সিরিজ দ্বারা অনুসরণ করা হয়। প্রতিটি DSPL ফাইলে অবশ্যই Google পাবলিক ডেটা স্কিমা অন্তর্ভুক্ত করতে হবে, যার URI হল "http://schemas.google.com/dspl/2010" এবং এটিকে ডিফল্ট নেমস্পেস হিসেবে ব্যবহার করুন৷ এটিতে "http://www.w3.org/2001/XMLSchema-instance" দ্বারা চিহ্নিত স্ট্যান্ডার্ড, W3 XML স্কিমা অন্তর্ভুক্ত করা উচিত। পরবর্তী বিভাগে বর্ণিত হিসাবে, অন্যান্য ডেটাসেট থেকে তথ্য অন্তর্ভুক্ত করার জন্য অন্যান্য নেমস্পেস যোগ করা যেতে পারে।

অন্যান্য ডেটাসেট নামস্থান আমদানি করা হচ্ছে

ডেটাসেট অন্যান্য ডেটাসেট থেকে সংজ্ঞা এবং ডেটা পুনরায় ব্যবহার করতে পারে। উদাহরণস্বরূপ, গুগল অনেকগুলি মৌলিক ডেটাসেট সরবরাহ করে যা সাধারণত ব্যবহারকারীর ডেটাতে উপস্থিত ধারণাগুলিকে সংজ্ঞায়িত করে। উদাহরণস্বরূপ, বেশিরভাগ ডেটাসেটের বছরগুলিকে উপস্থাপন করার জন্য একটি ধারণা প্রয়োজন। একটি নতুন ধারণা সংজ্ঞায়িত করার পরিবর্তে, আপনি "http://www.google.com/publicdata/dataset/time" ডেটাসেট থেকে বছরের ধারণাটি ব্যবহার করতে পারেন৷ আরও তথ্যের জন্য ক্যানোনিকাল ধারণা পৃষ্ঠা দেখুন।

একটি বহিরাগত ডেটাসেট ব্যবহার করতে, নামস্থান ঘোষণার ঠিক পরে DSPL ফাইলে <import> উপাদান যোগ করুন এবং আপনি যে ডেটাস্পেস আমদানি করছেন তা নির্দেশ করুন, এইভাবে:

<import namespace="http://www.google.com/publicdata/dataset/google/time"/>

তারপর, আপনার ফাইলের শীর্ষে নামস্থান ঘোষণায় আমদানি করা নামস্থান (এই ক্ষেত্রে, time="http://www.google.com/publicdata/dataset/google/time" ) যুক্ত করুন, এইভাবে:

<?xml version="1.0" encoding="UTF-8"?>
<dspl targetNamespace="http://www.stats-bureau.com/mystats"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xmlns="http://schemas.google.com/dspl/2010"
    xmlns:time="http://www.google.com/publicdata/dataset/google/time" >
<import namespace="http://www.google.com/publicdata/dataset/google/time"/>

আপনার DSPL ফাইলটি এখন Google পাবলিক ডেটা টাইম ডেটাসেট থেকে উপাদানগুলি উল্লেখ করতে পারে৷ আপনি উল্লেখ করতে চান এমন প্রতিটি ডেটাসেটের জন্য এই প্রক্রিয়াটি পুনরাবৃত্তি করুন।

বাহ্যিক ডেটাসেটে বিষয়বস্তু উল্লেখ করা

একবার আপনি অন্য ডেটাসেট আমদানি করলে, আপনাকে সেই ডেটাসেট থেকে ধারণা, স্লাইস এবং ডেটা উল্লেখ করতে সক্ষম হতে হবে। এটি করার জন্য, আপনি ফর্ম্যাট prefix:other_id , যেখানে prefix বহিরাগত ডেটাসেটের নামস্থানের জন্য ব্যবহৃত উপসর্গ।

এখানে time ডেটাসেট থেকে year ধারণার একটি রেফারেন্সের একটি উদাহরণ (উপরে বর্ণিত):

<slices>
  <slice id="country_slice">
    <dimension concept="country"/>
    <dimension concept="time:year"/>
    <metric concept="population"/>
    <table ref="country_slice_table"/>
  </slice>
  ...
</slices>

ডেটাসেট তথ্য

<info> উপাদানটিতে ডেটাসেট সম্পর্কে বর্ণনামূলক তথ্য রয়েছে। প্রাসঙ্গিক XML উপাদানগুলির একটি উদাহরণ এবং বিবরণ নীচে তালিকাভুক্ত করা হয়েছে৷

উদাহরণ

<info>
  <name>
    <value>Unemployment Rates</value>
  </name>
  <description>
    <value>Worldwide unemployment rates by region</value>
  </description>
  <url>
    <value>http://www.example.com/mystats/info.html</value>
  </url>
</info>

উপাদান

উপাদান প্রয়োজন? বর্ণনা
<info> হ্যাঁ ডেটাসেট সম্পর্কে সমস্ত বর্ণনামূলক তথ্য সংযুক্ত করে। চাইল্ড উপাদানগুলি অন্তর্ভুক্ত করে <name> , <description> , এবং <url>
<name> হ্যাঁ <info> এর সন্তান। চাইল্ড উপাদান <value> অন্তর্ভুক্ত করে, যা ডেটাসেটের নাম শনাক্ত করে।
<description> ঐচ্ছিক <info> এর সন্তান। চাইল্ড উপাদান <value> অন্তর্ভুক্ত করে, যার মধ্যে ডেটাসেটের একটি পাঠ্য বিবরণ রয়েছে।
<url> হ্যাঁ <info> এর সন্তান। ডেটাসেট সম্পর্কে আরও তথ্য সহ একটি URL এর একটি লিঙ্ক৷

প্রদানকারী তথ্য

<provider> উপাদান ডেটাসেট প্রদানকারী সম্পর্কে তথ্য তালিকাভুক্ত করে। প্রাসঙ্গিক XML উপাদানগুলির একটি উদাহরণ এবং বিবরণ নীচে তালিকাভুক্ত করা হয়েছে৷

উদাহরণ

<provider>
  <name>
    <value>Bureau of Statistics</value>
  </name>
  <url>
    <value>http://www.example.com</value>
  </url>
</provider>

উপাদান

উপাদান প্রয়োজন? বর্ণনা
<provider> হ্যাঁ ডেটাসেট প্রদানকারী সম্পর্কে সমস্ত বর্ণনামূলক তথ্য সংযুক্ত করে। চাইল্ড উপাদান <name> এবং <url> অন্তর্ভুক্ত করে।
<name> ঐচ্ছিক <provider> এর সন্তান। চাইল্ড উপাদান <value> অন্তর্ভুক্ত করে, যা ডেটাসেট প্রদানকারীর নাম শনাক্ত করে।
<url> ঐচ্ছিক <info> এর সন্তান। ডেটাসেট প্রদানকারী সম্পর্কে আরও তথ্য সহ একটি URL এর একটি লিঙ্ক৷

ধারণা

বর্ণনা

প্রতিটি ডেটাসেটে এক বা একাধিক ধারণা থাকে। একটি ধারণা হল এক ধরণের ডেটার সংজ্ঞা যা একটি ডেটাসেটে প্রদর্শিত হয়। ডেমোগ্রাফিক জনসংখ্যার ডেটা সহ একটি ডেটাসেট, উদাহরণস্বরূপ, দেশ, রাজ্য, জনসংখ্যা এবং বছর ধারণা থাকতে পারে। একটি প্রদত্ত ধারণার সাথে সম্পর্কিত ডেটা মানগুলিকে সেই ধারণার দৃষ্টান্ত বলা হয়। ধারণাগুলি সাধারণত ডেটাসেটে বর্ণিত হয়, তবে কিছু ধারণা (যেমন সময় বা বছর) বহিরাগত ডেটাসেটে বর্ণনা করা যেতে পারে।

প্রতিটি ধারণার এক বা একাধিক বৈশিষ্ট্য থাকতে পারে। একটি সম্পত্তি একটি ধারণা উদাহরণের একটি বৈশিষ্ট্য যা সময়ের সাথে স্থিতিশীল। উদাহরণস্বরূপ, দেশের ধারণার বৈশিষ্ট্যের name , population এবং capital থাকতে পারে।

ধারণার এক বা একাধিক বৈশিষ্ট্যও থাকতে পারে। বৈশিষ্ট্যগুলি ধারণার স্তরে তথ্য প্রদান করে, এর পৃথক দৃষ্টান্ত নয়। উদাহরণস্বরূপ, যদি আমাদের কাছে বেকারত্বের হারের ধারণা সহ একটি ডেটাসেট থাকে, তাহলে আমরা একটি বৈশিষ্ট্য ব্যবহার করতে পারি যে এই ধারণাটি একটি শতাংশ। বৈশিষ্ট্যগুলির একটি সাধারণ ব্যবহারের আরেকটি উদাহরণ হল ইউনিট তথ্য প্রদান করা।

উদাহরণ

এখানে অনন্য আইডি country এবং সম্পত্তির name সহ একটি দেশের ধারণার একটি উদাহরণ। ধারণা আইডিটি স্লাইস এবং টেবিল থেকে ধারণাটি উল্লেখ করতে ব্যবহার করা যেতে পারে।

<concept id="country" extends="geo:location">
  <info>
    <name><value>Country</value></name>
    <description>
      <value>My list of countries.</value>
    </description>
  </info>
  <type ref="string"/>
  <property id="name">
    <info>
      <name><value>Name</value></name>
      <description>
        <value>The official name of the country</value>
      </description>
    </info>
    <type ref="string" />
  </property>
  <property concept="geo:continent" isParent="true"/>
  <property id="capital" concept="geo:city" />
  <table ref="countries_table" />
</concept>

এখানে এই উদাহরণ কিভাবে কাজ করে.

  • এই কোডটি ধারণার দেশ বর্ণনা করে, যার আইডি country এবং বৈশিষ্ট্যের name , continent এবং capital রয়েছে।
  • ধারণাটি geo:location , অবস্থানের জন্য আদর্শ ধারণাকে প্রসারিত করে। geo:location প্রসারিত করার মাধ্যমে, country বর্ধিত ধারণা দ্বারা সংজ্ঞায়িত সমস্ত বৈশিষ্ট্য এবং গুণাবলীর উত্তরাধিকারী হয়: বৈশিষ্ট্যের নাম, বিবরণ, url, অক্ষাংশ এবং দ্রাঘিমাংশ। যতক্ষণ না বর্ধিত ধারণার দ্বারা প্রদত্ত সংজ্ঞাটির সাথে সামঞ্জস্যপূর্ণ থাকে ততক্ষণ country জন্য এই বৈশিষ্ট্য এবং বৈশিষ্ট্যগুলির মধ্যে কয়েকটিকে পুনরায় সংজ্ঞায়িত করা ঠিক আছে।
  • ধারণা <info> উপাদান ধারণা সম্পর্কে মূল তথ্য বর্ণনা করে। এটি পাবলিক ডেটা এক্সপ্লোরারে ডেটাসেটের ল্যান্ডিং পৃষ্ঠায় প্রদর্শিত হয়।
  • ধারণা <type> উপাদান সামগ্রীর ধরন বোঝায়। এই ক্ষেত্রে এটি স্ট্রিং, কিন্তু এই পরিবর্তিত হতে পারে. ধারণা জনসংখ্যার টাইপ integer থাকবে; ধারণা Eurovision winner টাইপ বুলিয়ান থাকতে পারে।
  • একটি <property> উপাদান ধারণার প্রতিটি বৈশিষ্ট্য বর্ণনা করে, এর অনন্য ID ( id ), info এবং type সহ। বৈশিষ্ট্যগুলি ধারণাগুলিকেও উল্লেখ করতে পারে, এটি নির্দেশ করতে যে তাদের মানগুলি সেই ধারণাগুলির বৈধ উদাহরণ।
  • ধারণাটি একটি ডেটা টেবিলের উল্লেখ করে যা প্রকৃত ডেটা ধারণকারী CSV ফাইলের দিকে নির্দেশ করে। ডেটা টেবিলটি এইভাবে উল্লেখ করা হয়েছে: <table ref="countries_table"/>

    যদি আপনার ধারণা একটি টেবিলের উল্লেখ করে, তাহলে সংশ্লিষ্ট ডেটা ফাইলটিকে অবশ্যই ধারণার সমস্ত উদাহরণ তালিকাভুক্ত করতে হবে। আপনি, উদাহরণস্বরূপ, একটি টেবিল তৈরি করতে পারবেন না যা ডেটাসেটে অন্তর্ভুক্ত দেশগুলির মধ্যে কয়েকটি তালিকা করে। (যদি আপনার পছন্দের দেশগুলির একটি উপসেট থাকে তবে আপনি তাদের বর্ণনা করার জন্য একটি পৃথক ধারণা তৈরি করতে পারেন৷ উদাহরণস্বরূপ, mycountries ৷)

উপাদান

উপাদান প্রয়োজন? বর্ণনা
<concepts> হ্যাঁ শীর্ষ-স্তরের উপাদান। সমস্ত <concept> উপাদানকে আবদ্ধ করে।
<concept> হ্যাঁ ধারণা চিহ্নিত করে। প্রয়োজনীয় অ্যাট্রিবিউট id মান অবশ্যই ডেটাসেটের মধ্যে থাকা ধারণার জন্য অনন্য হতে হবে। যদি ধারণাটি একটি ধারণা ডেটা টেবিলের উল্লেখ করে, তাহলে id মান অবশ্যই ডেটা টেবিলের ধারণাটি বর্ণনাকারী কলাম শিরোনামের সাথে মিলবে। একটি extends বৈশিষ্ট্য বোঝাতে ব্যবহার করা যেতে পারে যে এই ধারণাটি অন্য ধারণাকে প্রসারিত করে। extends মান অবশ্যই একই ডেটাসেটে সংজ্ঞায়িত একটি ধারণার আইডির সাথে মিলিত হতে হবে বা ফর্ম prefix:concept_id , যেখানে concept_id হল prefix সাথে যুক্ত আমদানি করা বহিরাগত ডেটাসেটে সংজ্ঞায়িত একটি ধারণার আইডি।
<info> ঐচ্ছিক ধারণা সম্পর্কে বর্ণনামূলক তথ্য সংযুক্ত করে।
<name> হ্যাঁ <info> এর সন্তান। ধারণার নাম। চাইল্ড এলিমেন্ট <value> তে পাঠ্য রয়েছে - উদাহরণস্বরূপ, Country
<description> ঐচ্ছিক <info> এর সন্তান। শিশু উপাদান <value> অন্তর্ভুক্ত করে, যার মধ্যে ধারণাটির একটি পাঠ্য বিবরণ রয়েছে।
<url> ঐচ্ছিক <info> এর সন্তান। চাইল্ড এলিমেন্ট অন্তর্ভুক্ত করে <value> , যা ধারণার জন্য একটি URL অন্তর্ভুক্ত করে।
<pluralName> ঐচ্ছিক <info> এর সন্তান। ধারণার বহুবচন নাম। চাইল্ড উপাদান <value> টেক্সট ধারণ করে - উদাহরণস্বরূপ, Countries
<totalName> ঐচ্ছিক <info> এর সন্তান। ধারণার সমস্ত দৃষ্টান্তের সমন্বয়ের নাম। চাইল্ড এলিমেন্ট <value> এ পাঠ্য রয়েছে- একটি country ধারণার ক্ষেত্রে, উদাহরণস্বরূপ, এটি World হতে পারে।
<type> ঐচ্ছিক ধারণা দ্বারা বর্ণিত বিষয়বস্তুর ধরন সনাক্ত করে। প্রয়োজনীয় অ্যাট্রিবিউট ref নিম্নলিখিত অনুমোদিত মান রয়েছে:
  • স্ট্রিং
  • ভাসা
  • পূর্ণসংখ্যা
  • তারিখ
  • বুলিয়ান
ধরনটি বাদ দেওয়া যেতে পারে যদি ধারণাটি অন্য ধারণাকে প্রসারিত করে, যে ক্ষেত্রে এটি বর্ধিত ধারণা থেকে উত্তরাধিকারসূত্রে পাওয়া যায়।
<property> ঐচ্ছিক

ধারণার একটি সম্পত্তি, যেমন capital । প্রয়োজনীয় অ্যাট্রিবিউট id মান অবশ্যই ধারণার জন্য অনন্য হতে হবে। একটি ঐচ্ছিক concept বৈশিষ্ট্য নির্দেশ করতে ব্যবহার করা যেতে পারে যে এই সম্পত্তির মান একটি প্রদত্ত ধারণার উদাহরণ। যদি concept নির্দিষ্ট করা হয়, তাহলে id বাদ দেওয়া যেতে পারে; এর মানটি উল্লেখিত ধারণার আইডি হিসাবে স্পষ্টভাবে সংজ্ঞায়িত করা হয়েছে (যেমন, <property concept="geo:country"/> <property id="country" concept="geo:country"/> /> এর সমতুল্য)।

একটি প্রপার্টিতে একটি বুলিয়ান isParent অ্যাট্রিবিউট থাকতে পারে, যাতে বোঝানোর জন্য যে ধারণার একটি উদাহরণ এবং এই সম্পত্তির মানের মধ্যে সম্পর্কটি শ্রেণীবদ্ধ।

ধারণার দৃষ্টান্ত এবং সম্পত্তির মানগুলির মধ্যে একটি 1-1 ম্যাপিং রয়েছে তা বোঝাতে একটি সম্পত্তিতে একটি বুলিয়ান isMapping বৈশিষ্ট্য থাকতে পারে।

একটি সম্পত্তি একটি নেস্টেড info এবং type নির্দিষ্ট করতে পারে, যেগুলি একটি ধারণার মতোই সংজ্ঞায়িত করা হয়। type প্রয়োজন যদি সম্পত্তি একটি concept বৈশিষ্ট্য নির্দিষ্ট না করে, এবং যদি তা হয় তাহলে উল্লেখিত ধারণার প্রকারের সাথে মেলে।

<attribute> ঐচ্ছিক

ধারণার একটি বৈশিষ্ট্য। বৈশিষ্ট্যগুলি ধারণা সম্পর্কে অতিরিক্ত তথ্য উপস্থাপন করে (যেমন, জিডিপি একটি শতাংশ)। প্রয়োজনীয় অ্যাট্রিবিউট id মান অবশ্যই ধারণার জন্য অনন্য হতে হবে। একটি ঐচ্ছিক concept বৈশিষ্ট্য নির্দেশ করতে ব্যবহার করা যেতে পারে যে এই বৈশিষ্ট্যের মানগুলি একটি প্রদত্ত ধারণার উদাহরণ। যদি concept নির্দিষ্ট করা হয়, তাহলে id বাদ দেওয়া যেতে পারে। এর মানটি রেফারেন্সযুক্ত ধারণার আইডি হিসাবে অন্তর্নিহিতভাবে সংজ্ঞায়িত করা হয়েছে। (যেমন, <attribute concept="unit:unit"/> <attribute id="unit" concept="unit:unit"/> /> এর সমতুল্য।

একটি বৈশিষ্ট্য একটি নেস্টেড info এবং type নির্দিষ্ট করতে পারে, যা একটি ধারণার মতোই সংজ্ঞায়িত করা হয়। type প্রয়োজন হয় যদি অ্যাট্রিবিউট একটি concept অ্যাট্রিবিউট নির্দিষ্ট না করে, এবং যদি এটি করে তাহলে অবশ্যই রেফারেন্সড কনসেপ্টের ধরনের সাথে মিল থাকতে হবে।

<table> ঐচ্ছিক ধারণার জন্য ডেটা ধারণকারী ডেটা টেবিল সনাক্ত করে। প্রয়োজনীয় ref অ্যাট্রিবিউটের মান অবশ্যই সম্পর্কিত <table> উপাদানে নির্দিষ্ট করা টেবিল আইডির সাথে মেলে।

স্লাইস

বর্ণনা

একটি স্লাইস ধারণাগুলির একটি সমন্বয় যার জন্য ডেটা বিদ্যমান। একটি স্লাইসে দুটি ধরণের ধারণার রেফারেন্স রয়েছে: মাত্রা এবং মেট্রিক্স । একটি মাত্রা হল একটি ধারণা যা আপনার ডেটা বিভাগ বা ফিল্টার করতে ব্যবহৃত হয়। একটি মেট্রিক, অন্যদিকে, প্রতিটি ডেটা পয়েন্টের সাথে সম্পর্কিত পর্যবেক্ষণ করা মান বা মানগুলিকে বর্ণনা করে।

সাধারণত, মাত্রাগুলি শ্রেণীবদ্ধ যেখানে মেট্রিকগুলি অ-শ্রেণীগত, সময়-পরিবর্তনশীল, সংখ্যাসূচক মান। প্রতিটির কিছু প্রোটোটাইপিকাল উদাহরণ নিম্নরূপ:

  • মাত্রা : দেশ, রাজ্য, কাউন্টি, অঞ্চল, বছর, মাস, লিঙ্গ, বয়স বিভাগ, শিল্প বিভাগ
  • মেট্রিক্স : জনসংখ্যা, জিডিপি, বেকারত্বের হার, সাক্ষরতা, রাজস্ব, খরচ, মূল্য

উদাহরণ

<slices>
  <slice id="country_slice">
    <dimension concept="country"/>
    <dimension concept="time:year"/>
    <metric concept="population"/>
    <table ref="country_slice_table"/>
  </slice>
  ...
</slices>

এখানে এই উদাহরণ কিভাবে কাজ করে.

  • এই স্লাইস দেশ অনুসারে জনসংখ্যার প্রতিনিধিত্ব করে।
  • এটির মেট্রিক population , এবং মাত্রা country এবং year রয়েছে। প্রতিটি মাত্রা ইতিমধ্যেই অন্যত্র সংজ্ঞায়িত একটি ধারণা। ধারণার country এবং মেট্রিক population বর্তমান স্লাইসের মতো একই ডেটাসেটে বিদ্যমান এবং এইভাবে উল্লেখ করা হয়েছে: concept="country"
  • ধারণার year আমদানি করা ডেটাসেট সময়ের মধ্যে বিদ্যমান, ধারণার নামের আগে ব্যবহৃত উপসর্গ দ্বারা চিহ্নিত ( year ), এইভাবে: concept="time:year"
  • স্লাইসটি একটি ডেটা টেবিলের উল্লেখ করে যা প্রকৃত ডেটা ধারণকারী CSV ফাইলের দিকে নির্দেশ করে। ডেটা টেবিলটি এইভাবে উল্লেখ করা হয়েছে: <table ref="country_slice_table"/> । ( ডেটাসেট আমদানির তথ্যের জন্য উপরে দেখুন।)

দ্রষ্টব্য: সাধারণভাবে, আপনার ডেটাসেট আরও নমনীয় হবে যদি আপনি মেট্রিক্সকে ন্যূনতম রাখেন এবং পরিবর্তে অর্থপূর্ণ মাত্রা তৈরি করেন। উদাহরণস্বরূপ, Female Unemployment এবং Male Unemployment মেট্রিকগুলি তৈরি করার পরিবর্তে, একক মেট্রিক Unemployment তৈরি করুন এবং Gender মাত্রা যোগ করুন যেখানে Female এবং Male উদাহরণ রয়েছে৷

উপাদান

উপাদান প্রয়োজন? বর্ণনা
<slices> হ্যাঁ শীর্ষ-স্তরের উপাদান। সমস্ত <slice> উপাদানগুলিকে আবদ্ধ করে।
<slice> ঐচ্ছিক স্লাইস সনাক্ত করে। প্রয়োজনীয় অ্যাট্রিবিউট id মান অবশ্যই স্লাইসের জন্য অনন্য হতে হবে।
<dimension> ঐচ্ছিক একটি ধারণা উল্লেখ করে, স্লাইসের একটি মাত্রা সংজ্ঞায়িত করে। প্রয়োজনীয় অ্যাট্রিবিউট concept মান অবশ্যই কনসেপ্টের ইউনিক আইডির সাথে মিলতে হবে এবং কনসেপ্টটি যদি এক্সটার্নাল ইম্পোর্ট করা ডেটাসেটের অন্তর্গত হয় তাহলে একটি বৈধ উপসর্গ ব্যবহার করতে হবে।
<metric> ঐচ্ছিক একটি ধারণা উল্লেখ করে, স্লাইসের একটি মেট্রিক সংজ্ঞায়িত করে। প্রয়োজনীয় অ্যাট্রিবিউট concept মান অবশ্যই কনসেপ্টের ইউনিক আইডির সাথে মিলতে হবে এবং কনসেপ্টটি যদি এক্সটার্নাল ইম্পোর্ট করা ডেটাসেটের অন্তর্গত হয় তাহলে একটি বৈধ উপসর্গ ব্যবহার করতে হবে।
<table> হ্যাঁ স্লাইসের জন্য ডেটা ধারণকারী ডেটা টেবিল সনাক্ত করে। প্রয়োজনীয় ref অ্যাট্রিবিউটের মান অবশ্যই সম্পর্কিত <table> উপাদানে নির্দিষ্ট করা টেবিল আইডির সাথে মেলে।
<mapDimension> ঐচ্ছিক <table> এর সন্তান। বৈশিষ্ট্য concept এবং toColumn ধারণ করে; প্রথমটির মানটি স্লাইসের একটি মাত্রা এবং দ্বিতীয়টির মানটি পূর্বের সাথে সামঞ্জস্যপূর্ণ টেবিল কলাম৷
<mapMetric> ঐচ্ছিক <table> এর সন্তান। বৈশিষ্ট্য concept এবং toColumn ধারণ করে; প্রথমটির মানটি স্লাইসের একটি মেট্রিক এবং দ্বিতীয়টির মানটি পূর্বের সাথে সামঞ্জস্যপূর্ণ টেবিল কলাম।

টেবিল

বর্ণনা

DSPL ফাইলের tables বিভাগটি ডেটাসেটে অন্তর্ভুক্ত ডেটা টেবিলগুলি সনাক্ত করে। এই টেবিলগুলি ধারণা দ্বারা বা স্লাইস দ্বারা উল্লেখ করা যেতে পারে। প্রতিটি <table> উপাদান টেবিলের কলাম এবং তাদের প্রকারগুলি নির্দিষ্ট করে, এবং টেবিলের ডেটা ধারণকারী একটি CSV ফাইলের দিকে নির্দেশ করে।

উদাহরণ

<tables>
  <table id="country_slice_table">
    <column id="country" type="string"/>
    <column id="year" type="date" format="yyyy"/>
    <column id="population" type="integer"/>
    <data>
      <file format="csv" encoding="utf-8">country_slice.csv</file>
    </data>
  </table>
  ...
</tables>

এই নমুনা কাজ কিভাবে এখানে.

  • এই নমুনা country_slice_table বর্ণনা করে। সারণিতে country , year এবং population কলাম রয়েছে।
  • টেবিলের প্রতিটি কলামের একটি অনন্য আইডি রয়েছে, যা id বৈশিষ্ট্য দ্বারা সংজ্ঞায়িত করা হয়েছে। এই আইডিটি অবশ্যই সংশ্লিষ্ট ডেটা ফাইলের উপযুক্ত কলাম শিরোনামের সাথে ঠিক মেলে।
  • ঐচ্ছিক type অ্যাট্রিবিউটের মান প্রতিটি কলামের জন্য ডেটা টাইপ নির্ধারণ করে।
  • <data> উপাদানটি টেবিলের ডেটা ধারণকারী প্রকৃত .csv ফাইল (country_slice.csv) বর্ণনা করে। ফাইল ফরম্যাট সবসময় csv হয়।

উপাদান

উপাদান প্রয়োজন? বর্ণনা
<tables> হ্যাঁ শীর্ষ-স্তরের উপাদান। সমস্ত <table> উপাদানগুলিকে আবদ্ধ করে।
<table> হ্যাঁ টেবিল সনাক্ত করে। প্রয়োজনীয় অ্যাট্রিবিউট id মান অবশ্যই টেবিলে অনন্য হতে হবে।
<column> ঐচ্ছিক <table> এর সন্তান। টেবিলে অন্তর্ভুক্ত একটি কলাম সম্পর্কে তথ্য। নিম্নলিখিত বৈশিষ্ট্যগুলি অন্তর্ভুক্ত করে:
  • id (প্রয়োজনীয়): কলামের আইডি।
  • type (ঐচ্ছিক): নির্দিষ্ট কলামে তথ্যের ডাটা টাইপ। অনুমোদিত মানগুলি হল: string , float , integer , date বা boolean
<data> ঐচ্ছিক <table> এর সন্তান। টেবিল দ্বারা উল্লেখ করা ডেটা ফাইল। যদি ফাইলের নামটি URL আকারে হয় (যেমন, http://... ), তাহলে ফাইলটি উপযুক্ত প্রোটোকলের (HTTP, HTTPS, বা FTP) মাধ্যমে আনা হবে; অন্যথায়, এই নামের একটি ফাইল অবশ্যই ডেটাসেটের সাথে বান্ডিল করতে হবে। প্রয়োজনীয় বৈশিষ্ট্য format মান সর্বদা csv হয়। যদিও encoding বৈশিষ্ট্য ঐচ্ছিক, আপনার .csv ফাইলগুলি অবশ্যই UTF-8 এনকোডেড হতে হবে৷

বিষয়

বর্ণনা

বিষয়গুলি ধারণাগুলিকে শ্রেণিবদ্ধভাবে শ্রেণিবদ্ধ করে, ব্যবহারকারীদের আপনার ডেটাসেটের মাধ্যমে আরও সহজে নেভিগেট করতে দেয়।

আপনার DSPL ফাইলের <concepts> উপাদানের ঠিক আগে <topic <topics> উপাদানটি উপস্থিত হওয়া উচিত। (উপাদানের ক্রম গুরুত্বপূর্ণ, এবং যদি আপনার উপাদানগুলি ভুল ক্রমে প্রদর্শিত হয় তবে আপনি আপনার ডেটাসেট আপলোড করতে সক্ষম হবেন না।) বিষয়গুলি ব্যবহার করতে, ধারণার সংজ্ঞা থেকে তাদের উল্লেখ করুন।

উদাহরণ

এখানে একটি উদাহরণ বিষয় সংজ্ঞা:

<topics>
  <topic id="population_indicators">
    <info>
      <name>
        <value>Population indicators</value>
      </name>
    </info>
  </topic>
  ...
</topics>
  

...এবং এখানে একটি ধারণা থেকে এই বিষয়টির একটি উদাহরণ উল্লেখ রয়েছে:

<concept id="population">
  <info>
    <name>
      <value>Population</value>
    </name>
    <description>
      <value>Size of the resident population.</value>
    </description>
  <topic ref="population_indicators"/>
  <type ref="integer"/>
</concept>

বিষয়গুলি নেস্ট করা যেতে পারে, এবং একটি ধারণা একাধিক বিষয় উল্লেখ করতে পারে।

উপাদান সংজ্ঞা

উপাদান প্রয়োজন? বর্ণনা
<topics> হ্যাঁ শীর্ষ-স্তরের উপাদান। সমস্ত <topic> উপাদানগুলিকে আবদ্ধ করে।
<topic> হ্যাঁ বিষয় চিহ্নিত করে। প্রয়োজনীয় অ্যাট্রিবিউট id মান অবশ্যই ডেটাসেটের জন্য অনন্য হতে হবে।
<info> ঐচ্ছিক <topic> এর সন্তান। একটি বিষয় সম্পর্কে তথ্য সংযুক্ত করে।
<name> ঐচ্ছিক <info> এর সন্তান। এর চাইল্ড এলিমেন্ট <value> বিষয়ের নাম নির্দিষ্ট করে।

DSPL ডেটা ফাইল

XML মেটাডেটা ফাইল ছাড়াও, একটি DSPL ডেটাসেট CSV ফর্ম্যাটে এক বা একাধিক ডেটা ফাইলও অন্তর্ভুক্ত করতে পারে। প্রতিটি ডেটা ফাইল ডেটাসেটের একটি টেবিলকে সমর্থন করে এবং এটির <data>...</data> বিভাগে পূর্বের থেকে উল্লেখ করা হয়। ধারণাগতভাবে, এই ফাইলগুলি এবং তাদের সম্পর্কিত টেবিলগুলি ধারণার সংজ্ঞা বা স্লাইস ডেটা উপস্থাপন করতে ব্যবহৃত হয়। এই ডেটা ফাইলের ধরনগুলির প্রত্যেকটি নীচে আরও বিশদে বর্ণনা করা হয়েছে।

লক্ষ্য করুন যে, উদ্দেশ্য নির্বিশেষে, সমস্ত ডেটা ফাইল অবশ্যই কমা-ডিলিমিটেড (CSV) UTF-8 টেক্সট ফাইল হতে হবে। ফাইলগুলিতে শুধুমাত্র প্লেইন টেক্সট থাকতে হবে; HTML নেই। আপনি ম্যানুয়ালি ডেটা ফাইলগুলি তৈরি করতে পারেন, কিন্তু বাস্তবিকভাবে আপনাকে মূল ডেটা উৎস (যেমন, একটি স্প্রেডশিট) বা রপ্তানি করা ফাইলে থাকা টুলে ডেটা ম্যাসেজ করতে হবে।

ফাইলগুলিকে ডেটাসেটের সাথে বান্ডিল করা যেতে পারে বা, যদি নামটি URL আকারে হয়, তাহলে HTTP, HTTPS বা দূরবর্তী উত্স থেকে FTP এর মাধ্যমে আনা হয়৷

ধারণা ডেটা ফাইল

কনসেপ্ট ডেটা ফাইলে প্রতিটি কনসেপ্টের জন্য প্রাসঙ্গিক তথ্য থাকে। ধারণা সংজ্ঞা এই ফাইলটি উল্লেখ করার জন্য <table> উপাদান ব্যবহার করে।

উদাহরণ

উপরে সংজ্ঞায়িত country ধারণার জন্য একটি টেবিলের উদাহরণ এখানে দেওয়া হল:

country, name
AD, Andorra
AF, Afghanistan
AI, Anguilla
AL, Albania
AO, Angola
AQ, Antarctica
AS, American Samoa

এই উদাহরণটি কীভাবে কাজ করে তা এখানে:

  • ম্যাপিং নির্দিষ্ট করা না থাকলে, ডেটা ফাইলের প্রথম লাইন (কলাম শিরোনাম) অবশ্যই কনসেপ্ট আইডি এবং ধারণার উপযুক্ত প্রপার্টি আইডির সাথে মিল থাকতে হবে যার সাথে ডেটা যুক্ত। যাইহোক, ডেটা ফাইল এবং ধারণা টেবিলে কলামের ক্রম একই হতে হবে না। এই ক্ষেত্রে, প্রথম কলামটি ধারণা country সাথে যুক্ত, এবং দ্বিতীয় কলামটি সম্পত্তি name সাথে যুক্ত।
  • সম্পত্তি কলাম ঐচ্ছিক; যদি একটি সম্পত্তির টেবিলে একটি কলাম না থাকে, তাহলে প্রতিটি সারির জন্য এর মান অনির্ধারিত বলে ধরে নেওয়া হয়। উপরের টেবিলটি, উদাহরণস্বরূপ, latitude এবং longitude বৈশিষ্ট্যগুলির জন্য কলামগুলি বাদ দেয়, তাই দেশগুলি ম্যাপযোগ্য হবে না৷
  • ধারণার আইডি ক্ষেত্রের প্রতিটি মান (এই ক্ষেত্রে, country ) অবশ্যই অনন্য এবং অ-খালি হতে হবে (একটি খালি ক্ষেত্র শূন্য বা শুধুমাত্র হোয়াইটস্পেস অক্ষর সহ একটি)।
  • বৈশিষ্ট্যের মানগুলি যেগুলি অন্যান্য ধারণার উল্লেখ করে সেগুলি অবশ্যই খালি হতে হবে বা উল্লেখিত ধারণার একটি বৈধ মান হতে হবে৷
  • দ্বৈত উদ্ধৃতিগুলির মধ্যে মানগুলিকে সংযুক্ত করা ঐচ্ছিক, যখন সেগুলিতে কমা, দ্বিগুণ উদ্ধৃতি, বা নতুন লাইন অক্ষর থাকে৷
  • একটি আক্ষরিক দ্বিগুণ উদ্ধৃতি থেকে এড়িয়ে যান যা একটি মানের সাথে অন্য একটি দ্বিগুণ উদ্ধৃতি দিয়ে পূর্বে প্রদর্শিত হয়৷

স্লাইস ডেটা ফাইল

স্লাইস ডেটা ফাইলগুলিতে প্রতিটি স্লাইসের জন্য প্রাসঙ্গিক ডেটা থাকে। স্লাইস সংজ্ঞা <table ref="..."> উপাদান ব্যবহার করে <table> সংজ্ঞা উল্লেখ করতে, যা এই ফাইলটিকে চিহ্নিত করে।

উদাহরণ

উপরে বর্ণিত population_by_country স্লাইসের জন্য ডেটা ধারণকারী একটি .csv ফাইলের উদাহরণ এখানে দেওয়া হল:

country, year, population
AF, 1960, 9616353
AF, 1961, 9799379
AF, 1962, 9989846
AF, 1963, 10188299

উদাহরণটি কীভাবে কাজ করে তা এখানে:

  • মেট্রিক ক্ষেত্র হল population । ক্ষেত্র country এবং year মাত্রা ক্ষেত্র.
  • একটি মাত্রা ক্ষেত্রের প্রতিটি মান খালি হতে হবে। এই সময়ের মাত্রা অন্তর্ভুক্ত. মেট্রিক ক্ষেত্রের মান খালি হতে পারে। একটি খালি মান কোন অক্ষর দ্বারা প্রতিনিধিত্ব করা হয়.
  • প্রতিটি কলামের শিরোনাম যা একটি ধারণার উল্লেখ করে (উদাহরণস্বরূপ, উপরের উদাহরণের প্রথম ক্ষেত্রটি ধারণার country উল্লেখ করে) ধারণার সংজ্ঞায় ধারণার অনন্য আইডির সাথে হুবহু মেলে।
  • মাত্রা মানগুলির একটি অনন্য সমন্বয়, যেমন AF, 2000 , শুধুমাত্র একবার ঘটতে পারে।
  • একই সময়ের সিরিজের সারিগুলি (অর্থাৎ, সময় ব্যতীত সমস্ত মাত্রার মানগুলির একই সংমিশ্রণ রয়েছে এমন সারিগুলিকে অবশ্যই একসাথে গোষ্ঠীবদ্ধ করতে হবে, যদিও সেগুলিকে অন্যভাবে সাজানোর দরকার নেই৷

উন্নত বৈশিষ্ট্য

বহু-ভাষা ডেটাসেট

অনুবাদিত XML মান

আপনি আপনার DSPL ফাইলের প্রতিটি <value> উপাদানের সাথে xml:lang অ্যাট্রিবিউট ব্যবহার করতে পারেন। এই বৈশিষ্ট্যটি মানক, W3C ভাষা ট্যাগ ব্যবহার করে উপাদানের বিষয়বস্তুর ভাষা নির্দিষ্ট করে। উল্লেখ্য যে এই বৈশিষ্ট্যটির ব্যবহার ঐচ্ছিক; যদি কোনো xml:lang বৈশিষ্ট্য অন্তর্ভুক্ত না হয়, তাহলে বিষয়বস্তু ইংরেজিতে বলে ধরে নেওয়া হয়।

নিম্নলিখিত উদাহরণটি ইংরেজি, বুলগেরিয়ান, কাতালান এবং সরলীকৃত চীনা ভাষায় একটি ডেটাসেটের স্নিপেট দেখায়:

<dspl ...>
  <info>
    <name>
      <value xml:lang="en">World Bank, World Development Indicators</value>
      <value xml:lang="bg">Световна банка, Индикатори за световно развитие</value>
      <value xml:lang="ca">Banc Mundial, Indicadors del desenvolupament mundial</value>
      <value xml:lang="zh-CN">国家/地区</value>
    </name>
    ...
  </info>

  <concepts>
    <concept id="country">
      <info>
        <name>
          <value xml:lang="en">Country</value>
          <value xml:lang="bg">Страна</value>
          <value xml:lang="ca">País</value>
          <value xml:lang="zh-CN">国家/地区</value>
        </name>
        ...
      </info>
      ...
    </concept>
    ...
  </concepts>

  ...
</dspl>

অনুবাদিত বৈশিষ্ট্য

কিছু ক্ষেত্রে, আপনি এমন অনুবাদগুলি প্রদান করতে চাইতে পারেন যা ধারণা-স্তরের মেটাডেটা অতিক্রম করে, পৃথক ধারণার দৃষ্টান্তগুলিতে অতিরিক্ত (বা পরিবর্তে) প্রয়োগ করে। এটি বিশেষভাবে কার্যকর যখন একটি ধারণা সম্পত্তির মান (যেমন, নাম) ভাষা অনুসারে পরিবর্তিত হয়।

একাধিক ভাষায় এই ধরনের মান প্রদান করতে, প্রতিটি সম্পত্তি/ভাষার সমন্বয়ের জন্য সংশ্লিষ্ট সংজ্ঞা সারণীতে একটি কলাম তৈরি করুন। তারপর, টেবিল রেফারেন্স ট্যাগে <mapProperty xml:lang="..." ref="..." toColumn="..."> উপাদানগুলির একটি সেট যোগ করে এই কলামগুলিকে তাদের সম্পর্কিত বৈশিষ্ট্য এবং ভাষার সাথে লিঙ্ক করুন ধারণা

এখানে একটি উদাহরণ রয়েছে যা ইংরেজি, স্প্যানিশ এবং ফরাসি ভাষায় নাম সহ একটি দেশের ধারণাকে সংজ্ঞায়িত করে:

<concepts>
  ...
  <concept id="country" extends="geo:location">
    ...
    <property id="name">
      <info>
        <name>
          <value>Name</value>
        </name>
        <description>
          <value>The official name of the country</value>
        </description>
      </info>
      <type ref="string" />
    </property>
    ...
    <table ref="countries_table">
      <mapProperty xml:lang="en" ref="name" toColumn="name_en"/>
      <mapProperty xml:lang="es" ref="name" toColumn="name_es"/>
      <mapProperty xml:lang="fr" ref="name" toColumn="name_fr"/>
    </table>
  </concept>
  ...
</concepts>

...

<tables>
  ...
  <table id="countries_table">
    <column id="country" type="string"/>
    <column id="name_en" type="string"/>
    <column id="name_es" type="string"/>
    <column id="name_fr" type="string"/>
    ...
  </table>
</tables>

তারপর countries_table জন্য CSV ফাইলের নিম্নলিখিত ফর্ম থাকবে:

country,name_en,name_es,name_fr,...
...
US,United States of America,Estados Unidos de América,États-Unis d'Amérique,...
...

ম্যাপযোগ্য ধারণা

অনেক ধারণার (উদাহরণস্বরূপ: কাউন্টি, রাজ্য এবং শহর) ভৌগলিক অবস্থানের সাথে সম্পর্কিত উদাহরণ রয়েছে। DSPL এই দৃষ্টান্তগুলিকে জিওকোডিং সমর্থন করে যাতে সেগুলি Google পাবলিক ডেটা অ্যানিমেটেড মানচিত্র চার্টে দৃশ্যমান হবে৷

যদি আপনার ধারণাটি বিশ্বের দেশ, মার্কিন রাজ্য বা মার্কিন কাউন্টির সমতুল্য হয়, তাহলে আপনি শুধুমাত্র সংশ্লিষ্ট Google ক্যানোনিকাল ধারণার সাথে লিঙ্ক করতে পারেন; কোন স্পষ্ট জিওকোডিং প্রয়োজন নেই. আরও বিস্তারিত জানার জন্য ক্যানোনিকাল ধারণার গাইড দেখুন।

যদি না হয়, তাহলে আপনাকে আপনার ধারণাকে ম্যাপযোগ্য করতে হবে। প্রথম ধাপ হল এটিকে geo:location থেকে প্রসারিত করা:

<concept id="..." extends="geo:location">
  ...
</concept>

তারপরে, আপনাকে অবশ্যই বৈশিষ্ট্য হিসাবে স্পষ্টভাবে অক্ষাংশ এবং দ্রাঘিমাংশ যোগ করতে হবে:

<concept id="..." extends="geo:location">
  ...
  <property id="latitude"/>
  <property id="longitude"/>
</concept>
  

এর জন্য মানগুলি তারপরে সংশ্লিষ্ট ধারণা সংজ্ঞা ডেটা টেবিলে কলাম হিসাবে নির্দিষ্ট করা হয়।

ধারণা সম্পর্ক

ধারণাগুলি প্রায়শই কাঠামোগত উপায়ে অন্যান্য ধারণাগুলির সাথে সম্পর্কিত। উদাহরণস্বরূপ, একটি মহাদেশের উদাহরণে একাধিক দেশের দৃষ্টান্ত অন্তর্ভুক্ত থাকতে পারে, যার ফলে, একাধিক রাজ্য বা প্রদেশের উদাহরণ থাকতে পারে। ডেটাসেট মেটাডেটাতে এই সম্পর্কগুলিকে এনকোড করা অন্যথায় সম্ভব হওয়ার চেয়ে সমৃদ্ধ ভিজ্যুয়ালাইজেশন বৈশিষ্ট্যগুলির জন্য মঞ্জুরি দেয়, যেমন, বেছে নেওয়ার জন্য অবস্থানগুলির একটি সংকীর্ণ গাছ দেখানো।

নীচের বিভাগে, আমরা DSPL স্কিমা সমর্থিত ধারণা সম্পর্ক বর্ণনা করি।

শ্রেণিবিন্যাস

শিশু ধারণার একটি <property> ট্যাগে একটি isParent="true" অ্যাট্রিবিউট ব্যবহারের মাধ্যমে DSPL-এ ধারণার শ্রেণিবিন্যাস উপস্থাপন করা হয়, যেটিতে পিতামাতার ধারণা থেকে দৃষ্টান্তের শনাক্তকারী রয়েছে।

উদাহরণ হিসেবে, গুগলের ইউএস কাউন্টি ধারণার নিম্নলিখিত রূপ রয়েছে:

<concept id="us_county" extends="geo:location">
  <info>
    <name>
      <value xml:lang="en">County</value>
    </name>
    ...
  </info>
  ...
  <property id="state" concept="us_state" isParent="true"/>
  ...
  <data>
    <table ref="reference_us_counties"/>
  </data>
</concept>
  

সমর্থনকারী ডেটা টেবিলে প্রতিটি কাউন্টির জন্য দুই-অক্ষরের রাজ্য কোড সহ একটি state কলাম রয়েছে। এই ধরনের মেটাডেটা পাবলিক ডেটা এক্সপ্লোরারকে রাজ্য এবং কাউন্টিগুলিকে একটি শ্রেণিবিন্যাস হিসাবে দেখানোর অনুমতি দেয়, এমন একটি বৈশিষ্ট্য যা ব্যবহারকারীদের জন্য অনুসন্ধানকে আরও সহজ করে তোলে।

মনে রাখবেন যে একটি ধারণার অনেক সন্তান থাকতে পারে কিন্তু একজনের বেশি পিতামাতা নয়।

ম্যাপিং

কনসেপ্ট ম্যাপিং (অর্থাৎ, ধারণা যা প্রতিনিধিত্ব করে, মৌলিকভাবে, একই জিনিস) ম্যাপ করা ধারণার একটি property ট্যাগে একটি isMapping="true" অ্যাট্রিবিউটের মাধ্যমে উপস্থাপন করা হয়।

নির্দিষ্ট করা যে একটি ধারণা অন্যটির সাথে মানচিত্রটি পূর্ববর্তীটিকে পরবর্তীটির সমস্ত বৈশিষ্ট্য এবং বৈশিষ্ট্যগুলি উত্তরাধিকারী হতে দেয়৷ অন্যান্য অ্যাপ্লিকেশনগুলির মধ্যে, এটি Google-এর ক্যানোনিকাল জিও ডেটাসেটে সংজ্ঞায়িত ব্যক্তিগত ভৌগলিক ধারণাগুলির সাথে "লিংক" করার জন্য দরকারী:

<concept id="my_country" extends="geo:location">
  <info>
    <name>
      <value xml:lang="en">Country</value>
    </name>
    ...
  </info>
  ...
  <property id="google_country_code" concept="geo:country" isMapping="true"/>
  <data>
    <table ref="countries_concept"/>
  </data>
</concept>
  

এক্সটেনশন

কনসেপ্ট এক্সটেনশনগুলি সংশ্লিষ্ট কনসেপ্টের সংজ্ঞায় একটি extends উপাদানের মাধ্যমে মনোনীত করা হয়। এক্সটেনশনগুলি ইঙ্গিত করার জন্য দরকারী যে একটি নির্দিষ্ট ধারণা অন্য, বিস্তৃত ধারণার একটি উপশ্রেণী। বর্ধিত ধারণাটি তার পিতামাতার সমস্ত বৈশিষ্ট্য এবং বৈশিষ্ট্যগুলিকে উত্তরাধিকার সূত্রে পায় এবং অতিরিক্তগুলিও যোগ করতে পারে৷

উদাহরণ হিসেবে, Google-এর currency ধারণা unit প্রসারিত করে:

<concept id="unit">
  ...
</concept>

<concept id="currency" extends="unit">
  <info>
    <name>
      <value xml:lang="en">Currency unit</value>
    </name>
    ...
  </info>
  ...
  <table ref="currency_table"/>
</concept>
  

আরও ব্যাখ্যা এবং উদাহরণের জন্য টিউটোরিয়ালে কনসেপ্ট এক্সটেনশনের আলোচনা দেখুন।

আপনার ডেটাসেট জমা দেওয়া হচ্ছে

Google পাবলিক ডেটা এক্সপ্লোরারে আপনার ডেটাসেট জমা দিতে, এই নির্দেশাবলী অনুসরণ করুন:

  1. একটি ডিরেক্টরি তৈরি করুন।
  2. আপনার তৈরি করা ডিরেক্টরিতে ডেটাসেট ডিএসপিএল ফাইলটি সংরক্ষণ করুন। .xml এক্সটেনশন ব্যবহার করতে ভুলবেন না।
  3. একই ডিরেক্টরিতে স্থানীয় .csv ফাইল সংরক্ষণ করুন। ইউআরএলের মাধ্যমে উল্লেখ করা ডেটা ফাইল বাদ দেওয়া যেতে পারে।
  4. ডিরেক্টরি জিপ করুন।
  5. Google পাবলিক ডেটা এক্সপ্লোরারে আপনার ডেটাসেট আপলোড করুন

একবার আপনার ডেটাসেট আপলোড এবং যাচাই হয়ে গেলে, আপনার Google অ্যাকাউন্টে সাইন ইন করার সময় আপনি এটি পরীক্ষা করতে পারেন। আপনি এটি পরীক্ষা না করা পর্যন্ত এবং এটি প্রস্তুত বলে আমাদের না জানানো পর্যন্ত এটি প্রকাশ করা হবে না৷