плавающие биты и строгое сглаживание

Я пытаюсь извлечь биты из float без вызова неопределенного поведения. Вот моя первая попытка:

unsigned foo(float x)
{
    unsigned* u = (unsigned*)&x;
    return *u;
}

как я понимаю, это не гарантируется из-за строгих правил сглаживания, верно? Работает ли это, если сделать промежуточный шаг с указателем символа?

unsigned bar(float x)
{
    char* c = (char*)&x;
    unsigned* u = (unsigned*)c;
    return *u;
}

или мне нужно извлечь отдельные байты самостоятельно?

unsigned baz(float x)
{
    unsigned char* c = (unsigned char*)&x;
    return c[0] | c[1] << 8 | c[2] << 16 | c[3] << 24;
}

конечно, это имеет недостаток в зависимости от endianness, но я мог бы жить с этим.

union hack определенно неопределенное поведение, не так ли?

unsigned uni(float x)
{
    union { float f; unsigned u; };
    f = x;
    return u;
}

просто для полноты, вот ссылочка версия foo. Также неопределенное поведение, верно?

unsigned ref(float x)
{
    return (unsigned&)x;
}

Итак, можно ли извлечь биты из поплавка (если обе 32-битные, конечно)?


EDIT: и вот memcpy версия, предложенная Goz. Так как многие компиляторы не поддерживают static_assert еще, Я заменил static_assert С некоторым шаблонное метапрограммирование:

template <bool, typename T>
struct requirement;

template <typename T>
struct requirement<true, T>
{
    typedef T type;
};

unsigned bits(float x)
{
    requirement<sizeof(unsigned)==sizeof(float), unsigned>::type u;
    memcpy(&u, &x, sizeof u);
    return u;
}

4 ответов


единственный способ действительно избежать каких-либо проблем-это memcpy.

unsigned int FloatToInt( float f )
{
   static_assert( sizeof( float ) == sizeof( unsigned int ), "Sizes must match" );
   unsigned int ret;
   memcpy( &ret, &f, sizeof( float ) );
   return ret;
}

поскольку вы memcpying фиксированную сумму компилятор оптимизирует его.

это говорит, что метод объединения очень широко поддерживается.


Union hack определенно неопределенное поведение, не так ли?

да и нет. Согласно стандарту, это определенно неопределенное поведение. Но это такой широко используемый трюк, что GCC и MSVC и, насколько я знаю, каждый другой популярный компилятор явно гарантирует, что он безопасен и будет работать так, как ожидалось.


следующее не нарушает правило сглаживания, потому что оно не использует lvalues, обращающиеся к различным типам в любом месте

template<typename B, typename A>
B noalias_cast(A a) { 
  union N { 
    A a; 
    B b; 
    N(A a):a(a) { }
  };
  return N(a).b;
}

unsigned bar(float x) {
  return noalias_cast<unsigned>(x);
}

Если вы действительно хотите быть агностиком о размере типа float и просто возвращать необработанные биты, сделайте что-то вроде этого:

void float_to_bytes(char *buffer, float f) {
    union {
        float x;
        char b[sizeof(float)];
    };

    x = f;
    memcpy(buffer, b, sizeof(float));
}

тогда назовите это так:

float a = 12345.6789;
char buffer[sizeof(float)];

float_to_bytes(buffer, a);

этот метод, конечно, будет производить вывод, специфичный для порядка байтов вашей машины.