پایگاه های اطلاعاتی
پایگاه دادهها [1] یا پایگاه اطلاعاتی، ذخیرهای از پروندههای [2] حاوی اطلاعات گوناگون و مرتبط بهصورت یکپارچه [3] و مبتنی بر ساختار واحدی است که امکان جستوجو و بازیابی سریع اطلاعات را توسط رایانه پدید میآورد. پایگاه اطلاعاتی بهگونهای شکل میگیرد که تسهیلاتی را برای ذخیره، درج، حذف، اصلاح، روزآمدسازی، و بازیابی اطلاعات پروندهها توسط یک یا چند کاربر بهصورت اشتراکی و همزمان فراهم سازد. غالبآ مدارک موجود در پایگاه اطلاعاتی ارائهدهنده اطلاعات همه پدیدههای فیزیکی مانند کتاب یا سایر متون منتشر شده مانند آثار هنری، اشیای قدیمی، یا حتی اطلاعات مربوط به یک فرد (مانند مدارک استخدامی یا اسناد پزشکی افراد) را در بر میگیرد. به عبارت دیگر این اطلاعات میتواند، دادههایی کامل از این اسناد باشد. پایگاه اطلاعاتی را میتوان بر روی رسانههایی مانند لوح سخت [4]، لوح لرزان [5]، لوح یا نوار مغناطیسی [6]، لوح نوری [7]، یا هر ابزار دیگر ذخیره کرد.
تاریخچه
در اواخر دهه 1960 و اوایل دهه 1970 ایجاد نظام یکپارچه مدیریت اطلاعات بهعنوان هدفی واحد مطرح شد و پایگاههای اطلاعاتی با این قصد بهوجود آمد که بتواند امکان ترکیب پروندههای جدا از هم، ایجاد ارتباط، مدیریت، و استفاده مشترک از دادهها را فراهم سازد. در نتیجه، افزونگی اطلاعات تا حدودی کاهش یافت، صحت و یکپارچگی اطلاعات ذخیره شده تا حدی تأمین شد، و امکان دسترسی مستقیم به اطلاعات و بازیابی آن، بهکمک چند کلید، و گزارشگیری ساده نیز فراهم گردید.
در دهه 1970، بهسبب تراکم اطلاعات ذخیره شده و ضرورت بازیابی اطلاعات مورد نیاز، یکپارچگی اطلاعات و به حداقل رساندن تکرار آن در پایگاههای اطلاعاتی اهمیت بیشتری یافت و موجب شد که در تهیه برنامههای کاربردی، روشهای کارآمدتری نسبت به ذخیره و بازیابی اطلاعات ابداع شود و پایگاههای اطلاعاتی امروزی شکل گیرد. این پایگاهها دسترسی چندجانبه به اطلاعات، کنترل اطلاعات، سازماندهی مجدد، ارتباط میان عناصر اطلاعاتی، امنیت اطلاعات، تهیه گزارشهای پیچیده، و تهیه برنامههای کاربردی مستقل از داده را امکانپذیر ساخت. از دهه 1980، با توسعه دانش در زمینههاینظامهای خبره و هوش مصنوعی [8] [9]، تحولی در نظام ذخیره و بازیابی اطلاعات بهوجود آمد.
پایگاههای اطلاعاتی با استفاده از منطق صوری، نظام خبره، هوش مصنوعی، و زبان طبیعی امکان استنتاج منطقی از دادهها را به کاربران میدهند؛ و بدینترتیب، فنآوری نوین سبب ایجاد پایگاههای دانش [10] شده است.
در ایران نیز از سال 1362، تلاشهایی بهمنظور ایجاد پایگاههای اطلاعاتی خودکار آغاز شد (6: 1-3) لیکن تا اواخر دهه 60 نتیجه ملموسی حاصل گردید. مراکز پایگاههای اطلاعاتی ایران در حال حاضر بهطور عمده حاصل تلاشها و کوششهایی است که از سال 1368 آغاز گردیده و تاکنون ادامه داشته است.
اجزای پایگاه اطلاعاتی [11]
محیط پایگاه اطلاعاتی از اجزائی چون دادهها، سختافزار، نرمافزار، و کاربران تشکیل شده است. هر پایگاه اطلاعاتی مجموعهای از دادههاست که بهصورت یکپارچه مورد استفاده قرار میگیرد. دادههای هر پایگاه میان کاربران مختلف به اشتراک گذاشته میشود و از داده واحدی ممکن است برای مقاصد مختلف استفاده گردد.
از سوی دیگر، پایگاه اطلاعاتی برای استقرار و اجرا نیاز به تجهیزات سختافزاری نظیر دستگاههای ذخیرهسازی، پردازشگرها [12]، و سختافزارهای ارتباطی [13] دارد. در ضمن، هر پایگاه اطلاعاتی دارای لایهای نرمافزاری به نام "نظام مدیریت پایگاه اطلاعاتی" [14] است که ارتباط میان استفادهکنندگان و اطلاعات ذخیره شده بر روی دستگاهها را برقرار میسازد. از طریق این نرمافزار میتوان به اطلاعات پایگاه دست یافت.
کاربران پایگاههای اطلاعاتی را سه گروه تشکیل میدهند:
1) برنامهسازان کاربردی [15] که پایگاه اطلاعاتی را طراحی میکنند و، با استفاده از دادههای موجود در پایگاه، آن را توسعه میدهند و برنامههای جدیدی را تهیه میکنند؛
2) استفادهکنندگان نهایی که با استفاده از پایگاهها میتوانند به اطلاعات مورد نیاز دست یابند و از آنها استفاده کنند؛
3) مدیران پایگاه دادهها که کار کنترل پایگاه اطلاعاتی را برعهده داشته و معمولا از توان بالایی برای تجزیه و تحلیل نیازها و تصمیمگیری در مورد روش ذخیره، دسترسی، بازیابی، و کنترل اطلاعات برخوردارند.
عناصر پایگاه اطلاعاتی [16]
هر پایگاه اطلاعاتی از عناصری شامل واژگان دادهها [17]، نوع دادهها، دامنه دادهها [18]، حوزه دادهها (فیلد)، پیشینه (رکورد)ها، رابطهها [19]، و نمایهها تشکیل شده است. واژگان دادهها مجموعهای مرتب از پروندهها، نمایهها، نگارهها، و اقلام اطلاعاتی برنامه کاربردی است که برای برنامهنویس سرعت و سهولت زیادی را در نوشتن برنامههای پایگاه اطلاعاتی ایجاد میکند. نوع دادههای هر حوزه (فیلد) نیز مشخص و تعریف میشود تا برنامه کاربردی بتواند آنها را در هر زمان و به هر شکل پردازش و بازیابی کند. متداولترین نوع دادهها شامل دادههای مربوط به متن، عدد، تاریخ، تصویر، و یادداشت است.
دادههای متن از حروف، اعداد، و نشانهها تشکیل شده است. داده عددی شامل اعداد صحیح، حقیقی، و اعشاری است. داده تاریخ بهگونهای ذخیره میشود که برنامه کاربردی بتواند آن را تشخیص دهد. داده یادداشت برای ذخیره متنهای طولانی مانند چکیدهها یا مقالات بهکار میرود.
حوزهها فضاهایی هستند که دادههای ذخیره شده در پایگاه اطلاعاتی را در خود جای میدهند. نام، نوع، و اندازه هر حوزه (فیلد) در پایگاه اطلاعاتی تعریف میشود و برای هر حوزه عنوانی متناسب با محتوای آن انتخاب میگردد. افزونگی در حوزهها وجود ندارد، مگر برای حوزههایی که، به عنوان کلید، ارتباط میان پیشینهها (رکورد) را فراهم میسازند.
پیشینهها مجموعهای از حوزهها هستند که درباره موضوعی خاص در ارتباطی منطقی قرار میگیرند. رابطهها در پایگاههای اطلاعاتی این امکان را فراهم میکنند که پیشینهها بهگونهای مورد نیاز سازماندهی شوند. بهطور مثال، پیشینه اطلاعات کتابشناختی مدارک، که در فرایند فهرستنویسی مورد استفاده قرار میگیرد، با استفاده از رابطه میتواند در کارهای امانت یا سفارش مورد استفاده قرار گیرد. نمایهها (شاخصها) در پایگاههای اطلاعاتی عامل مهمی در ذخیره اطلاعات حوزهها هستند و با وجود آنها برای بازیابی اطلاعات خاص نیازی به پیمایش سراسر پایگاه نیست، در نتیجه اطلاعات با سرعت بیشتری بازیابی میشود.
انواع پایگاه اطلاعاتی
پایگاههای اطلاعاتی را بارویکردهای متفاوتی تقسیمبندی کردهاند. برخی صاحبنظران، انواع پایگاه اطلاعاتی را به شرح ذیل میدانند:
1. پایگاه اطلاعاتی تک پرونده [20]، که در آن اطلاعات از یک پرونده را در هر زمان ذخیره، سازماندهی، و بازیابی میکنند. در این پایگاهها حوزههای مربوط به یک موضوع میتواند تکراری باشد و امکان حذف حوزههای زائد در پیشینهها وجود ندارد، در نتیجه، افزونگی اطلاعات در این پایگاهها بسیار زیاد است.
2. پایگاه اطلاعاتی سلسله مراتبی [21]، که در آن پیشینهها به صورت سلسلهمراتبی و درختی در رابطهای پدر و فرزندی قرار میگیرند. تنها یک پیشینه، ریشه درخت است و هر پیشینه فقط یک رابطه با پیشینه قبلی خود دارد، ولی در برقراری رابطه با پیشینههای بعدی خود محدودیتی ندارد. در این نوع پایگاه ارتباط میان پیشینهها بسیار سریع است، اما برخی پیشینهها با توجه به نوع ارتباط تکرار میشوند و موجب افزایش حجم پایگاه اطلاعاتی میگردند.
3. پایگاه اطلاعاتی شبکهای [22]، که در آن رابطه میان انواع پیشینهها یک به چند است و هیچ محدودیتی در تعداد آنها نیست. چند پیشینه در رابطه با یک پیشینه که خود با چند پیشینه دیگر مرتبط است قرار میگیرند. انعطافپذیری در تعداد رابطههای میان پیشینهها موجب میشود که پیشینهها در محلی که بیشترین کارآیی را دارند قرار نگیرند، و سرعت برقراری ارتباط میان آنها نسبت به مدل سلسلهمراتبی کاهش یابد. البته با قرار دادن پیشینههای مرتبط نزدیک به هم این مشکل را میتوان تا حدودی برطرف ساخت. برتری نوع شبکهای نسبت به نوع سلسله مراتبی، استفاده از یک پیشینه در رابطههای نامحدود است و نیازی به تکرار پیشینههای یکسان نیست. در نتیجه از افزونگی اطلاعات کاسته شده و اندازه پایگاه کوچکتر میگردد.
4. پایگاه اطلاعاتی رابطهای [23]، که در آن رابطهها به شیوهای خاص، یعنی به صورت جدول، به کار رفتهاند و در واقع همان پایگاه شبکهای است. این پایگاه برای نخستین بار در سال 1970 توسط یکی از کارشناسان شرکت آی. بی. ام. ابداع شد و در آن، سازماندهی اطلاعات برپایه جدولها (رابطهها)، سطرها (پیشینهها) و ستونها (حوزهها) صورت میگیرد. با استفاده از الگوهای ریاضی در مجموعهها، عملیات مشابه بر روی اطلاعات صورت میگیرد. در این پایگاه، نوع پیشینهها بهصورت جدول و حوزههای مربوط به آنها بهصورت ستونی در جدول قرار میگیرند. هر سطر جدول پیشینهای است که بهوسیله کلید مشخصی با جدول دیگر که دارای همان کلید در یکی از سطرهاست مرتبط میشود. در هر رابطه یا جدول تنها یک نوع پیشینه میتواند وجود داشته باشد و هر پیشینه دارای تعداد ثابتی حوزه یا ستون است. در این نوع پایگاه، افزونگی اطلاعات وجود ندارد و گزارشگیری بسیار ساده، راحت، و سریع انجام میگیرد.
5. پایگاه اطلاعاتی شیی گرا [24]، که بهمنظور ایجاد نرمافزاری بهتر، کوچکتر، و بدون تناقض بهوجود آمد و متشکل از مجموعهای از شییهاست. هر شیی دارای اطلاعات (ویژگیها [25]) و برنامهها (روشها [26])یی است که میتواند اطلاعات درون شیی را پردازش کند. شیی نفوذناپذیر است، یعنی نمیتوان برنامه درونی آن را تغییر داد. فقط از طریق پیام میتوان با آن رابطه برقرار کرد. هر شییî، پس از دریافت پیام، آن را پردازش کرده و سپس پیام(های) مناسبی را ارسال میکند. در ساختار این پایگاهها شیِیها که دارای تواناییهای مشترک هستند در رده واحدی قرار میگیرند و هر رده میتواند دارای زیر ردههایی باشد که از تواناییهای رده بالاتر از خود نیز برخوردار است.
6. پایگاه اطلاعاتی توزیعی، که برمبنای بانکهای اطلاعاتی توزیعی شکل میگیرد و، در واقع، برای ذخیره و بازیابی دادههای غیرمتمرکز بر روی رایانههای مراکز مختلف ایجاد میگردد. بهطور مثال، چندین کتابخانه که در شبکهای واحد با یکدیگر همکاری میکنند، با ایجاد پایگاه اطلاعاتی توزیعی در شبکه، میتوانند از برنامههای کاربردی یکدیگر استفاده کنند.
با رویکردی دیگر، پایگاه اطلاعاتی را میتوان چنین طبقهبندی کرد:
1. پایگاه اطلاعاتی کتابشناختی [27]. این نوع پایگاه ارائه دهنده انواع گوناگون انتشارات بوده واطلاعات مربوط به آنها شامل عنوان، نام نویسنده(ها)، ناشر، تاریخ نشر، احتمالا ویژگیهای فیزیکی (بهطور مثال، شماره صفحات)، و کلیدواژههایی از موضوع اثر است. روشنترین مثال از این نوع، پایگاههای اطلاعاتی فهرست کتابهای یک کتابخانه یا پایگاه اطلاعاتی مقالات نشریات علمی یا عمومی است. این نکته قابل توجه است که پایگاه اطلاعاتی کتابشناختی ارائه دهنده متن اصلی اثر نبوده و فقط اطلاعات توصیفی را دربر میگیرد.
2. پایگاه اطلاعاتی تمام متن [28]. این پایگاه شامل متن کامل منابع - نه فقط مشخصات ظاهری آنها است. متن کامل مقالات روزنامهها و نشریات، قوانین، گزارشهای فنی شرکتها، پیامهای گروههای مباحثه در اینترنت، و مکاتبات سازمانها نمونههایی از اینگونه پایگاهها هستند.
3. پایگاه اطلاعاتی تصویر [29]. این پایگاه شبیه پایگاه اطلاعاتی کتابشناختی است، با این تفاوت که اطلاعات موجود در آن توصیفکننده تصاویر است، مانند نقاشیهای موجود در یک گالری هنر، عکسها، یا منابع ویژهای چون تصاویر پرتونگاری. دادهها فقط نشاندهنده خطوط ظاهری تصویر نبوده و ممکن است توصیفکننده مفهوم آن نیز باشند؛ بهطور مثال، اطلاعاتی از قبیل مکانی که عکس در آن گرفته شده یا نقاشی ترسیم شده یا اطلاعاتی در مورد رنگ و بافت نقاشی را نیز شامل میشود.
4. پایگاه اطلاعاتی ارجاعی [30]. این پایگاه میتواند شامل فهرست اشیاء نمایشی در یک موزه یا فهرست گیاهان یک ناحیه خاص باشد. همچنین این نوع پایگاه میتواند ارائه دهنده نکات خاصی باشد که در انواع دیگر پایگاهها موجود نیست؛ مانند اطلاعاتی در مورد کوزهگری که نیازمند توصیف بهوسیله شکل، ابعاد، رنگ، و تاریخ کوزهگری بهطور کامل است.
5. پایگاه اطلاعاتی عددی و آماری [31]. این پایگاه عمدتآ شامل اطلاعات عددی است و آمار گوناگونی مانند اسناد فروش یا دادههای علمی همچون خواص فیزیکی مواد را دربر میگیرد.
6. پایگاه اطلاعاتی توصیفی [32]. این نوع پایگاه نکاتی موجز با طیفی گسترده از توضیحاتی درباره نواحی جغرافیایی خاص، برنامههای ارائه شده توسط دانشگاهها یا دانشکدهها، یا امکانات یک شرکت را دربر میگیرد.
بعضی از صفحات خانگی [33] موجود در اینترنت را میتوان نمونهای از پایگاههای اطلاعاتی توصیفی بهشمار آورد. پایگاههای اطلاعاتی توصیفی شامل نکات اصلی متن (حاوی اطلاعات آماری و تصاویر متن) هستند، به همین سبب میتوان آنها را جزو گروه پایگاههای اطلاعاتی تمام متن نیز برشمرد. پایگاههای اطلاعاتی توصیفی غالبآ به شکل الکترونیکی اسناد چاپی اشاره میکند. واژه کلیتر پایگاههای اطلاعاتی متنی [34] نیز میتواند شامل متن اصلی آثار داستانی باشد.
7. پایگاههای اطلاعاتی راهنماها و سایر منابع مرجع [35]. این پایگاهها شامل شکل الکترونیکی انواع گوناگون کتابهای مرجع مانند راهنمای سازمانها و اشخاص یا واژهنامههاست. این نوع پایگاه ترکیبی از پایگاههایی است که به آن اشاره شد؛ بهطور مثال، یک دایرهالمعارف ممکن است هم دارای متن و هم دارای تصویر باشد. این پایگاهها با بهرهگیری از امکاناتچندرسانهای مانند صوت و تصویر، برقراری رابطه تعاملی با کاربران را فراهم میآورند.
مآخذ:
1) خسروانی، جعفر. "بررسی وضعیت پایگاههای اطلاعاتی معاجم لفظی و موضوعی مرکز تحقیقات کامپیوتری علو اسلامی". پایاننامه کارشناسی ارشد کتابداری و اطلاعرسانی، دانشکده علوم تربیتی و روانشناسی، دانشگاه تهران، 1374؛
2) روحانی رانکوهی، محمدتقی. مقدمهای بر پایگاه دادهها (بانک اطلاعاتی). {تهران}: جلوه، 1372؛
3) شورای عالی انفورماتیک کشور. دبیرخانه. ویژهنامه پایگاه دادهها: خبرنامه انفورماتیک. تهران: سازمان برنامه و بودجه، مرکز مدارک اقتصادی - اجتماعی و انتشارات، 1374؛
4) فرهنگ اصطلاحات کامپیوتری (Webster): شامل شرح 4500 اصطلاح کامپیوتری بههمراه جدیدترین واژههای مربوط به PCها. "پایگاه اطلاعاتی"؛
5) فرهنگ کاربران کامپیوتر. ادیک باغداساریان. ذیل "پایگاه اطلاعاتی"؛
6) مرکز اسناد و مدارک علمی ایران. طرح پیشنهادی شبکه اطلاعرسانی علمی و صنعتی کشور. تهران، 1362؛
7) "Data base". The New Encyclopedia Britannica. 15th ed. Vol. 3: Micropaedia Ready Reference. PP. 896-897;
8) "atabase". Encyclopedia of Library and Information Science. Vol 51, P. 107;
9) Date, C.J. An Introductionto Data base Systems. Vol. 1. 5th ed. Reading, Ma: Addison - Wesley Publishing co., 1990;
10) Jacso, Peter; Lancaster, F.W. Database. Chicago: ALA, 1999;
11) Maryanski, F. "Data base Administrator". Encyclopedia of Computer Science and Engineering. PP. 440-441;
12) Moulton, lynda W. Data bases for Special Libraries: a Strotegic Guide to Information Management. London: Green Wood Press, 1991;
13) Olle, T.W. "Data base Management". Encyclopedia of Computer Science and Engineering. Vol. 1, P. 441-447;
14) Semsarzadeh, Gholam Ali. "New Developments in Conception of Application Software". Washington, D.C. 1997 (Poly Copy);
15) Vargo, Mary O. "Data base Computer". Encyclopedia of Computer Science 3 rd. ed. PP. 412-413.
پی نوشت:
[1]. Database
[2]. Files
[3]. Integrated
[4]. Hard disk
[5]. Floppy disk
[6]. Magnetic disk / Tape
[7]. Optical disk
[8]. Expert system
[9]. Artificial intelligence
[10]. Knowledge base
[11]. Database components
[12]. Processors
[13]. Communication hardware
[14]. Database Management System (DBMS)
[15]. Application programmer
[16]. Database clements
[17]. Data dictionary
[18]. Data domain
[19]. Relations
[20]. Flat-file database
[21]. Hierarchical database
[22]. Networked database
[23]. relational database
[24]. Object-oriented database
[25]. Properties
[26] Methods
[27]. Biblilgraphic databases
[28]. Full-text databases
[29]. Image database
[30]. Database referring to other physical objects
[31]. Numeric and statistical database
[32]. Descriptive database
[33]. Home page
[34]. Text database
[35]. Directories and other "reference sources" database
● برگرفته از دایرة المعارف کتابداری و اطلاعرسانی، http://portal.nlai.ir/daka نوشته بیبی سیده اسحاقزاده؛ محمدرضا قانع
نظر شما