elastic · elasticsearchmachine · Jun 8, 2023 · Jun 5, 2023 · Jun 6, 2023 · Jun 7, 2023
diff --git a/benchmarks/src/main/java/org/elasticsearch/benchmark/vector/DistanceFunctionBenchmark.java b/benchmarks/src/main/java/org/elasticsearch/benchmark/vector/DistanceFunctionBenchmark.java
@@ -110,19 +110,20 @@ private KnnFloatBenchmarkFunction(int dims, boolean normalize) {
  private abstract static class BinaryFloatBenchmarkFunction extends BenchmarkFunction {
 
  final BytesRef docVector;
+ final float[] docFloatVector;
  final float[] queryVector;
 
  private BinaryFloatBenchmarkFunction(int dims, boolean normalize) {
  super(dims);
 
- float[] docVector = new float[dims];
+ docFloatVector = new float[dims];
  queryVector = new float[dims];
 
  float docMagnitude = 0f;
  float queryMagnitude = 0f;
 
  for (int i = 0; i < dims; ++i) {
- docVector[i] = (float) (dims - i);
+ docFloatVector[i] = (float) (dims - i);
  queryVector[i] = (float) i;
 
  docMagnitude += (float) (dims - i);
@@ -136,11 +137,11 @@ private BinaryFloatBenchmarkFunction(int dims, boolean normalize) {
 
  for (int i = 0; i < dims; ++i) {
  if (normalize) {
- docVector[i] /= docMagnitude;
+ docFloatVector[i] /= docMagnitude;
  queryVector[i] /= queryMagnitude;
  }
 
- byteBuffer.putFloat(docVector[i]);
+ byteBuffer.putFloat(docFloatVector[i]);
  }
 
  byteBuffer.putFloat(docMagnitude);
@@ -178,6 +179,7 @@ private KnnByteBenchmarkFunction(int dims) {
  private abstract static class BinaryByteBenchmarkFunction extends BenchmarkFunction {
 
  final BytesRef docVector;
+ final byte[] vectorValue;
  final byte[] queryVector;
 
  final float queryMagnitude;
@@ -187,12 +189,14 @@ private BinaryByteBenchmarkFunction(int dims) {
 
  ByteBuffer docVector = ByteBuffer.allocate(dims + 4);
  queryVector = new byte[dims];
+ vectorValue = new byte[dims];
 
  float docMagnitude = 0f;
  float queryMagnitude = 0f;
 
  for (int i = 0; i < dims; ++i) {
  docVector.put((byte) (dims - i));
+ vectorValue[i] = (byte) (dims - i);
  queryVector[i] = (byte) i;
 
  docMagnitude += (float) (dims - i);
@@ -238,7 +242,7 @@ private DotBinaryFloatBenchmarkFunction(int dims) {
 
  @Override
  public void execute(Consumer<Object> consumer) {
- new BinaryDenseVector(docVector, dims, Version.CURRENT).dotProduct(queryVector);
+ new BinaryDenseVector(docFloatVector, docVector, dims, Version.CURRENT).dotProduct(queryVector);
  }
  }
 
@@ -250,7 +254,7 @@ private DotBinaryByteBenchmarkFunction(int dims) {
 
  @Override
  public void execute(Consumer<Object> consumer) {
- new ByteBinaryDenseVector(docVector, dims).dotProduct(queryVector);
+ new ByteBinaryDenseVector(vectorValue, docVector, dims).dotProduct(queryVector);
  }
  }
 
@@ -286,7 +290,7 @@ private CosineBinaryFloatBenchmarkFunction(int dims) {
 
  @Override
  public void execute(Consumer<Object> consumer) {
- new BinaryDenseVector(docVector, dims, Version.CURRENT).cosineSimilarity(queryVector, false);
+ new BinaryDenseVector(docFloatVector, docVector, dims, Version.CURRENT).cosineSimilarity(queryVector, false);
  }
  }
 
@@ -298,7 +302,7 @@ private CosineBinaryByteBenchmarkFunction(int dims) {
 
  @Override
  public void execute(Consumer<Object> consumer) {
- new ByteBinaryDenseVector(docVector, dims).cosineSimilarity(queryVector, queryMagnitude);
+ new ByteBinaryDenseVector(vectorValue, docVector, dims).cosineSimilarity(queryVector, queryMagnitude);
  }
  }
 
@@ -334,7 +338,7 @@ private L1BinaryFloatBenchmarkFunction(int dims) {
 
  @Override
  public void execute(Consumer<Object> consumer) {
- new BinaryDenseVector(docVector, dims, Version.CURRENT).l1Norm(queryVector);
+ new BinaryDenseVector(docFloatVector, docVector, dims, Version.CURRENT).l1Norm(queryVector);
  }
  }
 
@@ -346,7 +350,7 @@ private L1BinaryByteBenchmarkFunction(int dims) {
 
  @Override
  public void execute(Consumer<Object> consumer) {
- new ByteBinaryDenseVector(docVector, dims).l1Norm(queryVector);
+ new ByteBinaryDenseVector(vectorValue, docVector, dims).l1Norm(queryVector);
  }
  }
 
@@ -382,7 +386,7 @@ private L2BinaryFloatBenchmarkFunction(int dims) {
 
  @Override
  public void execute(Consumer<Object> consumer) {
- new BinaryDenseVector(docVector, dims, Version.CURRENT).l1Norm(queryVector);
+ new BinaryDenseVector(docFloatVector, docVector, dims, Version.CURRENT).l1Norm(queryVector);
  }
  }
 
@@ -394,7 +398,7 @@ private L2BinaryByteBenchmarkFunction(int dims) {
 
  @Override
  public void execute(Consumer<Object> consumer) {
- consumer.accept(new ByteBinaryDenseVector(docVector, dims).l2Norm(queryVector));
+ consumer.accept(new ByteBinaryDenseVector(vectorValue, docVector, dims).l2Norm(queryVector));
  }
  }
 

diff --git a/docs/changelog/96617.yaml b/docs/changelog/96617.yaml
@@ -0,0 +1,5 @@
+pr: 96617
+summary: Improve brute force vector search speed by using Lucene functions
+area: Search
+type: enhancement
+issues: []
diff --git a/server/src/main/java/org/elasticsearch/index/mapper/vectors/VectorEncoderDecoder.java b/server/src/main/java/org/elasticsearch/index/mapper/vectors/VectorEncoderDecoder.java
@@ -36,26 +36,23 @@ public static float decodeMagnitude(Version indexVersion, BytesRef vectorBR) {
  /**
  * Calculates vector magnitude
  */
- private static float calculateMagnitude(Version indexVersion, BytesRef vectorBR) {
- final int length = denseVectorLength(indexVersion, vectorBR);
- ByteBuffer byteBuffer = ByteBuffer.wrap(vectorBR.bytes, vectorBR.offset, vectorBR.length);
+ private static float calculateMagnitude(float[] decodedVector) {
  double magnitude = 0.0f;
- for (int i = 0; i < length; i++) {
- float value = byteBuffer.getFloat();
- magnitude += value * value;
+ for (int i = 0; i < decodedVector.length; i++) {
+ magnitude += decodedVector[i] * decodedVector[i];
  }
  magnitude = Math.sqrt(magnitude);
  return (float) magnitude;
  }
 
- public static float getMagnitude(Version indexVersion, BytesRef vectorBR) {
+ public static float getMagnitude(Version indexVersion, BytesRef vectorBR, float[] decodedVector) {
  if (vectorBR == null) {
  throw new IllegalArgumentException(DenseVectorScriptDocValues.MISSING_VECTOR_FIELD_MESSAGE);
  }
  if (indexVersion.onOrAfter(Version.V_7_5_0)) {
  return decodeMagnitude(indexVersion, vectorBR);
  } else {
- return calculateMagnitude(indexVersion, vectorBR);
+ return calculateMagnitude(decodedVector);
  }
  }
 
@@ -70,7 +67,7 @@ public static void decodeDenseVector(BytesRef vectorBR, float[] vector) {
  }
  ByteBuffer byteBuffer = ByteBuffer.wrap(vectorBR.bytes, vectorBR.offset, vectorBR.length);
  for (int dim = 0; dim < vector.length; dim++) {
- vector[dim] = byteBuffer.getFloat();
+ vector[dim] = byteBuffer.getFloat((dim * Float.BYTES) + vectorBR.offset);
  }
  }
 

diff --git a/server/src/main/java/org/elasticsearch/script/field/vectors/BinaryDenseVector.java b/server/src/main/java/org/elasticsearch/script/field/vectors/BinaryDenseVector.java
@@ -9,38 +9,36 @@
 package org.elasticsearch.script.field.vectors;
 
 import org.apache.lucene.util.BytesRef;
+import org.apache.lucene.util.VectorUtil;
 import org.elasticsearch.Version;
 import org.elasticsearch.index.mapper.vectors.VectorEncoderDecoder;
 
-import java.nio.ByteBuffer;
 import java.util.List;
 
 public class BinaryDenseVector implements DenseVector {
 
- protected final BytesRef docVector;
- protected final int dims;
- protected final Version indexVersion;
+ private final BytesRef docVector;
 
- protected float[] decodedDocVector;
+ private final int dims;
+ private final Version indexVersion;
 
- public BinaryDenseVector(BytesRef docVector, int dims, Version indexVersion) {
+ private final float[] decodedDocVector;
+
+ public BinaryDenseVector(float[] decodedDocVector, BytesRef docVector, int dims, Version indexVersion) {
+ this.decodedDocVector = decodedDocVector;
  this.docVector = docVector;
  this.indexVersion = indexVersion;
  this.dims = dims;
  }
 
  @Override
  public float[] getVector() {
- if (decodedDocVector == null) {
- decodedDocVector = new float[dims];
- VectorEncoderDecoder.decodeDenseVector(docVector, decodedDocVector);
- }
  return decodedDocVector;
  }
 
  @Override
  public float getMagnitude() {
- return VectorEncoderDecoder.getMagnitude(indexVersion, docVector);
+ return VectorEncoderDecoder.getMagnitude(indexVersion, docVector, decodedDocVector);
  }
 
  @Override
@@ -50,22 +48,14 @@ public int dotProduct(byte[] queryVector) {
 
  @Override
  public double dotProduct(float[] queryVector) {
- ByteBuffer byteBuffer = wrap(docVector);
-
- double dotProduct = 0;
- for (float v : queryVector) {
- dotProduct += byteBuffer.getFloat() * v;
- }
- return dotProduct;
+ return VectorUtil.dotProduct(decodedDocVector, queryVector);
  }
 
  @Override
  public double dotProduct(List<Number> queryVector) {
- ByteBuffer byteBuffer = wrap(docVector);
-
  double dotProduct = 0;
  for (int i = 0; i < queryVector.size(); i++) {
- dotProduct += byteBuffer.getFloat() * queryVector.get(i).floatValue();
+ dotProduct += decodedDocVector[i] * queryVector.get(i).floatValue();
  }
  return dotProduct;
  }
@@ -77,22 +67,18 @@ public int l1Norm(byte[] queryVector) {
 
  @Override
  public double l1Norm(float[] queryVector) {
- ByteBuffer byteBuffer = wrap(docVector);
-
  double l1norm = 0;
- for (float v : queryVector) {
- l1norm += Math.abs(v - byteBuffer.getFloat());
+ for (int i = 0; i < queryVector.length; i++) {
+ l1norm += Math.abs(queryVector[i] - decodedDocVector[i]);
  }
  return l1norm;
  }
 
  @Override
  public double l1Norm(List<Number> queryVector) {
- ByteBuffer byteBuffer = wrap(docVector);
-
  double l1norm = 0;
  for (int i = 0; i < queryVector.size(); i++) {
- l1norm += Math.abs(queryVector.get(i).floatValue() - byteBuffer.getFloat());
+ l1norm += Math.abs(queryVector.get(i).floatValue() - decodedDocVector[i]);
  }
  return l1norm;
  }
@@ -104,21 +90,14 @@ public double l2Norm(byte[] queryVector) {
 
  @Override
  public double l2Norm(float[] queryVector) {
- ByteBuffer byteBuffer = wrap(docVector);
- double l2norm = 0;
- for (float queryValue : queryVector) {
- double diff = byteBuffer.getFloat() - queryValue;
- l2norm += diff * diff;
- }
- return Math.sqrt(l2norm);
+ return Math.sqrt(VectorUtil.squareDistance(queryVector, decodedDocVector));
  }
 
  @Override
  public double l2Norm(List<Number> queryVector) {
- ByteBuffer byteBuffer = wrap(docVector);
  double l2norm = 0;
- for (Number number : queryVector) {
- double diff = byteBuffer.getFloat() - number.floatValue();
+ for (int i = 0; i < queryVector.size(); i++) {
+ double diff = decodedDocVector[i] - queryVector.get(i).floatValue();
  l2norm += diff * diff;
  }
  return Math.sqrt(l2norm);
@@ -156,8 +135,4 @@ public boolean isEmpty() {
  public int getDims() {
  return dims;
  }
-
- private static ByteBuffer wrap(BytesRef dv) {
- return ByteBuffer.wrap(dv.bytes, dv.offset, dv.length);
- }
 }
diff --git a/...src/main/java/org/elasticsearch/script/field/vectors/BinaryDenseVectorDocValuesField.java b/...src/main/java/org/elasticsearch/script/field/vectors/BinaryDenseVectorDocValuesField.java
@@ -13,25 +13,30 @@
 import org.elasticsearch.Version;
 import org.elasticsearch.index.mapper.vectors.DenseVectorFieldMapper.ElementType;
 import org.elasticsearch.index.mapper.vectors.DenseVectorScriptDocValues;
+import org.elasticsearch.index.mapper.vectors.VectorEncoderDecoder;
 
 import java.io.IOException;
 
 public class BinaryDenseVectorDocValuesField extends DenseVectorDocValuesField {
 
- protected final BinaryDocValues input;
- protected final Version indexVersion;
- protected final int dims;
- protected BytesRef value;
+ private final BinaryDocValues input;
+ private final float[] vectorValue;
+ private final Version indexVersion;
+ private boolean decoded;
+ private final int dims;
+ private BytesRef value;
 
  public BinaryDenseVectorDocValuesField(BinaryDocValues input, String name, ElementType elementType, int dims, Version indexVersion) {
  super(name, elementType);
  this.input = input;
  this.indexVersion = indexVersion;
  this.dims = dims;
+ this.vectorValue = new float[dims];
  }
 
  @Override
  public void setNextDocId(int docId) throws IOException {
+ decoded = false;
  if (input.advanceExact(docId)) {
  value = input.binaryValue();
  } else {
@@ -54,20 +59,28 @@ public DenseVector get() {
  if (isEmpty()) {
  return DenseVector.EMPTY;
  }
-
- return new BinaryDenseVector(value, dims, indexVersion);
+ decodeVectorIfNecessary();
+ return new BinaryDenseVector(vectorValue, value, dims, indexVersion);
  }
 
  @Override
  public DenseVector get(DenseVector defaultValue) {
  if (isEmpty()) {
  return defaultValue;
  }
- return new BinaryDenseVector(value, dims, indexVersion);
+ decodeVectorIfNecessary();
+ return new BinaryDenseVector(vectorValue, value, dims, indexVersion);
  }
 
  @Override
  public DenseVector getInternal() {
  return get(null);
  }
+
+ private void decodeVectorIfNecessary() {
+ if (decoded == false && value != null) {
+ VectorEncoderDecoder.decodeDenseVector(value, vectorValue);
+ decoded = true;
+ }
+ }
 }