一、归并排序思想

归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide andConquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。 归并排序核心步骤 :

我们现在要树立这么一个思路,分解数组并不是真的分解数组,而是可以通过下标的形式来区分数组。归并排序实际上就是将一个数组分解到不能子啊分解的部分,两两经行比较排序,再将数据更新到新的数组中去。这非常类似于我们学的数的后序遍历。

二、代码实现

1、单趟:

我们先写单趟,因为归并排序是对半分组,所以最后为两个区间经行比较,思路转化为之前我们学过的两个数组的合并

int mid = (rigt + left) / 2;
int begin1 = left;
int end1 = mid-1;
int begin2 = mid;
int end2 = rigt;
int i = left;
while (begin1 <= end1 && begin2 <= end2)
{

	if (a[begin1] > a[begin2])
	{
		tmp[i++] = a[begin2++];
	}
	else
	{
		tmp[i++] = a[begin1++];
	}
}
while (begin1<=end1)
{
	tmp[i++] = a[begin1++];
}
while (begin2 <= end2)
{
	tmp[i++] = a[begin2++];
}
memcpy(a+left, tmp+left, sizeof(int) * (rigt - left + 1));

这里要注意两个问题:1、区间怎么划分合适,2、为什么每排序一次就得将数组拷贝回去

 2、单趟问题解释

首先我们先解决第一个问题:区间怎么划分合适?

我们这里以下面图为例:

因为有-1的存在很容易导致下标为负数,最后导致数组的违法访问。同时可能还会有死循环的问题:

具体原因如下:

但是如果改为区间为 

int begin1 = left;
int end1 = mid;
int begin2 = mid+1;
int end2 = rigt;就不会出现这个问题:

所以正确代码如下:

int mid = (rigt + left) / 2;
int begin1 = left;
int end1 = mid;
int begin2 = mid+1;
int end2 = rigt;
int i = left;
while (begin1 <= end1 && begin2 <= end2)
{

	if (a[begin1] > a[begin2])
	{
		tmp[i++] = a[begin2++];
	}
	else
	{
		tmp[i++] = a[begin1++];
	}
}
while (begin1<=end1)
{
	tmp[i++] = a[begin1++];
}
while (begin2 <= end2)
{
	tmp[i++] = a[begin2++];
}
memcpy(a+left, tmp+left, sizeof(int) * (rigt - left + 1));

第二个问题:因为比较的时候是在原数组经行比较如果不及时将数组内容更新,可能会导致再排序时经行错误的大小比较,最后导致结果错误 

3、总体代码实现

结束条件当分割区间等于1或者小于1的时候。

void _MergeSort(int* a, int* tmp, int left, int rigt)
{
	if (left >= rigt)
	{
		return;
	}
	int mid = (rigt + left) / 2;
	_MergeSort(a, tmp, left, mid);
	_MergeSort(a, tmp, mid + 1, rigt);
	int begin1 = left;
	int end1 = mid;
	int begin2 = mid+1;
	int end2 = rigt;
	int i = left;
	while (begin1 <= end1 && begin2 <= end2)
	{

		if (a[begin1] > a[begin2])
		{
			tmp[i++] = a[begin2++];
		}
		else
		{
			tmp[i++] = a[begin1++];
		}
	}
	while (begin1<=end1)
	{
		tmp[i++] = a[begin1++];
	}
	while (begin2 <= end2)
	{
		tmp[i++] = a[begin2++];
	}
	memcpy(a+left, tmp+left, sizeof(int) * (rigt - left + 1));
}
void MergeSort(int* a, int n)
{
	int* tmp = (int*)malloc(sizeof(int) * n);
	if (tmp == NULL)
	{
		return;
	}
	else
	{
		_MergeSort(a, tmp, 0, n - 1);
		free(tmp);
		tmp = NULL;
	}
}

三、非递归

对于归并排序我们实现非递归用循环更好一点,非递归我们可以直接从递归回去那出发,定义一个组个数,通过控制组的个数实现“并”这个过程:

还是我们先写一个数组只有一个数的情况:

for (int i = 0; i < end - begin + 1; i += 2 * gap)//每次比较两组,所以加2gap
{
	int begin1 = i;
	int end1 = begin1 + gap - 1;
	int begin2 = begin1 + 2 * gap - 1;//第二组的开头与第一组的开头差2倍
	int end2 = begin2 + gap - 1;
	int k = i;
	while (begin1 <= end1 && begin2 <= end2)
	{

		if (a[begin1] > a[begin2])
		{
			tmp[k++] = a[begin2++];
		}
		else
		{
			tmp[k++] = a[begin1++];
		}
	}
	while (begin1 <= end1)
	{
		tmp[k++] = a[begin1++];
	}
	while (begin2 <= end2)
	{
		tmp[k++] = a[begin2++];
	}
	memcpy(a + i, tmp + i, sizeof(int) * (2 * gap));//同理这里也得排序一次就拷贝回去

}

那么后面就是gap*2控制即可:

void _MergeSortNonR(int* a, int* tmp,int begin, int end)
{
	int gap = 1;
	for (int j = gap; j < end-begin+1; j *= 2)
	{
		for (int i = 0; i < end - begin + 1; i += 2 * gap)//每次比较两组,所以加2gap
		{
			int begin1 = i;
			int end1 = begin1 + gap - 1;
			int begin2 = begin1 + 2 * gap - 1;//第二组的开头与第一组的开头差2倍
			int end2 = begin2 + gap - 1;
			int k = i;
			while (begin1 <= end1 && begin2 <= end2)
			{

				if (a[begin1] > a[begin2])
				{
					tmp[k++] = a[begin2++];
				}
				else
				{
					tmp[k++] = a[begin1++];
				}
			}
			while (begin1 <= end1)
			{
				tmp[k++] = a[begin1++];
			}
			while (begin2 <= end2)
			{
				tmp[k++] = a[begin2++];
			}
			memcpy(a + i, tmp + i, sizeof(int) * (2 * gap));
		}
	}
}

但是上面的代码仍然存在问题,和快排类似这里会存在数组越界问题:这里我们打印数组下标区间来观察一下:、

大致我们可以分为这两种情况:

 如果end1越界,那么说明分为了只有这一组数据,不用排了直接跳出循环,如果end2越界我们就需要给end2修改值。

所以改进代码如下:

void _MergeSortNonR(int* a, int* tmp,int begin, int end)
{
	int gap = 1;
	for (int j = gap; j < end-begin+1; j *= 2)
	{
		for (int i = 0; i < end - begin + 1; i += 2 * gap)//每次比较两组,所以加2gap
		{
			int begin1 = i;
			int end1 = begin1 + gap - 1;
			int begin2 = begin1 + 2 * gap - 1;//第二组的开头与第一组的开头差2倍
			int end2 = begin2 + gap - 1;
			int k = i;
			// 第二组都越界不存在,这一组就不需要归并
			if (begin2 >= end - begin + 1)
				break;

			// 第二的组begin2没越界,end2越界了,需要修正一下,继续归并
			if (end2 >= end - begin + 1)
				end2 = end - begin + 1 - 1;
			while (begin1 <= end1 && begin2 <= end2)
			{

				if (a[begin1] > a[begin2])
				{
					tmp[k++] = a[begin2++];
				}
				else
				{
					tmp[k++] = a[begin1++];
				}
			}
			while (begin1 <= end1)
			{
				tmp[k++] = a[begin1++];
			}
			while (begin2 <= end2)
			{
				tmp[k++] = a[begin2++];
			}
			memcpy(a + i, tmp + i, sizeof(int) * (2 * gap));
		}
	}
}
void MergeSortNonR(int* a, int n)
{
	int* tmp = (int*)malloc(sizeof(int) * n);
	if (tmp == NULL)
	{
		return;
	}
	else
	{
		_MergeSortNonR(a, tmp, 0, n - 1);
		free(tmp);
		tmp = NULL;
	}
}

可能有人会想如果只剩一组数据了,我直接return行不行?实际上是可以的,因为break跳出循环后在gap*2还是只有一组数据,所以直接return即可。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部