مدیریت رشته در سی
مدیریت رشتهها در سی اشاره به گروهی از توابع در کتابخانه استاندارد سی دارد که برای مدیریت و انجام عملیات مختلف بر روی رشتهها پیادهسازی شدهاند. عملیات مختلفی مانند کپی کردن رشتهها، الحاق رشتهها به یکدیگر، نشانه گذاری و جستجو پشتیبانی میشوند.
تعاریف
در زبان برنامهنویسی سی، یک رشته عبارتست از یک توالی پیوسته از کاراکترها که به یک کاراکتر تهی ختم میشوند. کاراکتر تهی (که به صورت '\0' نوشته شده و دارای کد اسکی 0 است) هم جزئی از رشته به حساب میآید. در سی دو نوع رشته وجود دارد. یکی رشته بایتی و دیگری رشته توسعهیافته. یک رشته بایتی از نوع char تعریف شده و دربرگیرنده کاراکترهای ۸ بیتی است. رشته توسعه یافته از نوع wchar_t تعریف شده و دربرگیرنده کاراکترهای ۱۶ بیتی است.
یک تصور اشتباه رایج این است که تمام آرایههای کاراکتری رشته هستند، چون لیترالهای رشتهای در هنگام کامپایل به آرایه تبدیل میشوند. این مهم است به یاد داشته باشید که یک رشته در هنگام رسیدن به اولین کاراکتر تهی ('\0') پایان مییابد. یک آرایه یا لیترال رشتهای که قبل از آخرین بایتش حاوی یک (یا چند) کاراکتر تهی است، دربرگیرنده یک رشته (یا در صورت امکان دربرگیرنده چندین رشته) است، اما خودش یک رشته نیست. در مقابل، میتوان یک آرایه کاراکتری ایجاد کرد که اصلاً حاوی کاراکتر تهی نیست و حتی به کاراکتر تهی هم ختم نمیشود، بنابراین این آرایه یک رشته نیست. زمانیکه احتیاج به صرفهجویی در حافظه باشد، میتوان از char به عنوان عدد صحیح استفاده کرد. برای مثال وقتی که احتیاج به آرایهای از مقادیر بولی داریم.
در زبان سی از عبارت اشارهگر به رشته برای توصیف اشارهگری که به اولین بایت (پایینترین آدرس) یک رشته اشاره میکند، استفاده میشود. در سی، از اشارهگرها برای ارسال رشتهها به توابع استفاده میشود. در مستندات اغلب واژه رشته به معنی اشارهگر به رشته است.
عبارت طول یک رشته برای توصیف تعداد بایتهایی که ماقبل کاراکتر تهی قرار دارند، استفاده میشود. برای مثال طول رشته A بیست بایت است، به این معنیست که ۱۹ بایت (هر بایت یک کاراکتر) قبل از کاراکتر تهی قرار دارد و آدرس اولین بایت در اشارهگر A قرار دارد. (خود کاراکتر تهی هم جزء رشته به حساب میآید) strlen یک تابع استاندارد برای بدست آوردن طول یک رشته است.
مروری بر توابع
اکثر توابع مرتبط با رشتهها در فایل سرآیند string.h تعریف شدهاند. (سرآیند cstring در سی++) توابع مربوط به رشتههای توسعه یافته هم در فایل wchar.h تعریف شدهاند. (سرآیند cwchar در سی++) این سرآیندها همچنین حاوی اعلانات توابعی هستند که برای مدیریت بافرهای حافظه مورد استفاده قرار میگیرند.
رشتههایی که در سرآیند string.h تعریف شدهاند بسیار محبوب هستند، از آنجا که آنها بخشی از توابع استاندارد سی به حساب میآیند، کارکرد آنها بر روی هر پلتفرمی که از سی پشتیبانی میکند تضمین شدهاست. با این حال برخی از این رشتهها مشکلات امنیتی مانند سرریز بافر دارند.
منابع
ویکیپدیای انگلیسی